王小川发布搜索增强的Baichuan2接口产品,称 AI 大模型不再是工具而是“新物种”|钛媒体焦点
创始人
2024-01-08 13:09:56
0

原标题:王小川发布搜索增强的Baichuan2接口产品,称 AI 大模型不再是工具而是“新物种”|钛媒体焦点

百川智能创始人、CEO 王小川

随着新一轮 AI 大模型浪潮席卷一年多之后,王小川团队加速推进大模型成果,以完成百川智能的生态布局。

钛媒体App获悉,12月19日下午,王小川创立的 AI 大模型公司百川智能,在北京发布基于搜索增强的Baichuan2-Turbo系列API(应用程序编程接口),包含Baichuan2-Turbo-192K 及Baichuan2-Turbo产品,即日起产品可开放使用,从而逐步构建百川智能完整的大模型技术栈。

百川智能创始人、CEO王小川表示,大模型+搜索构成了完整的技术栈。搜索增强是大模型发展的必由之路,解决了搜索+长窗口结合产生的技术挑战。他指出,将动态知识引入模型中,在垂直领域,尤其是领域知识不易公开获取的场景,模型本身的领域知识严重不足,而借助搜索增强,则可以实现大模型和领域知识、全网知识的全新链接。利用大模型+搜索增强方案可解决99%企业知识库的定制化需求。

王小川对钛媒体App表示,现在的 AI 大模型不是在创造工具,而是创造更像人一样的“新物种”。

“在互联网时代,火车、计算机、电脑、AI 更多是工具,都要求精确的方式进行互动,提高人类效率。但今天,其实我们造的是‘新物种’,‘造’的是一种人类伙伴,它就不需要像工具一样那么精确。所以在 AI 大模型时代下,我们对它的定义和思考方法是有别于此前的想法。”王小川表示。

据悉,百川智能创立于2023年4月10日,由搜狗公司创始人、前CEO王小川创立,旨在打造中国版的OpenAI,构建中国最好的大模型底座,帮助大众轻松、普惠地获取世界知识和专业服务,并在医疗、互联网等领域应用落地。其核心团队由搜狗、谷歌、腾讯、百度、华为、微软、字节等科技公司的 AI 顶尖人才组成。

目前,百川智能的团队规模已经超过200人,其中研发人员占比超80%。

过去的253天里,百川智能平均每四个星期发布一款大模型,已经接连发布Baichuan-7B/13B、Baichuan2-7B/13B四款开源可免费商用大模型,以及530亿参数的Baichuan-53B、Baichuan2-53B、Baichuan2-192K三款闭源大模型。其中,Baichuan-7B/13B两款开源大模型在多个权威评测榜单均名列前茅,累计下载量超过600万次,在写作、文本创作等领域能力已达到行业较好水平。

融资方面,截至目前,百川智能已公布首轮和A1轮战略融资,累计融资额已超过3.5亿美元(约合25亿元人民币),投资方包括阿里、腾讯、小米、深创投、基石资本等机构。百川智能赞未透露当前具体估值,仅表示融资后公司跻身于科技独角兽行列。根据一般定义,独角兽估值超过10亿美元(约合72.66亿元)。

8月31日,百川智能率先通过国家《生成式人工智能服务管理暂行办法》备案,是首批八家公司中唯一一家今年成立的大模型初创公司,并于9月25日开放Baichuan2-53B API接口,正式进军To B企业端领域,开启商业化进程。

12月4日晚间,鸿博股份披露一则合同公告,百川智能最近与英博数科签署了《云服务协议》,在协议期限内英博数科向百川提供高性能计算或GPU算力技术等服务。协议涉及交易总金额预计13.82亿元。

此次,百川智能主要围绕“大模型+搜索增强”方案公布Baichuan2-Turbo系列API技术细节。

百川智能称,Baichuan2-Turbo系列API在支持192K超长上下文窗口的基础上,还增加了搜索增强知识库的能力。即日起,API用户可上传文本资料来创建自身专属知识库,从而根据自身业务需求打造更完整、高效的智能解决方案。

百川智能表示,其自研的向量模型使用了超过 1.5T token 的高质量中文数据进行预训练,并在通用RAG(检索增强生成)的技术基础上增加大模型自省技术,以解决“幻觉”加重的现象。而且,百川智能通过长窗口+搜索增强的方式,在192K(19.2万)长上下文窗口的基础上,将大模型能够获取的原本文本规模提升了两个数量级,达到5000万tokens,通过搜索增强等技术放置在长窗口模型中有效节省了推理费用和时间成本,并且稀疏检索+向量检索的方式可以实现95%的回答精度,高于单纯的向量检索80%的回答精度。

百川智能强调,搜索增强技术是大模型落地应用的关键,能够有效解决幻觉、时效性差、专业领域知识不足等阻碍大模型应用的核心问题。这种技术不仅有效提升了模型性能,并且使大模型能“外挂硬盘”,实现互联网实时信息+企业完整知识库的“全知”,而且还能让大模型精准理解用户意图,在互联网和专业/企业知识库海量的文档中找到与用户意图最相关的知识,然后将足够多的知识加载到上下文窗口,借助长窗口模型对搜索结果做进一步的总结和提炼,更充分地发挥上下文窗口能力,帮助模型生成最优结果,从而实现各技术模块之间的联动,形成一个闭环的强大能力网络。

据钛媒体App了解,目前,基于百川通用大模型的搜索增强服务价格为0.03元/次(接口自动判断调用搜索增强服务的次数);而基于知识库API接口,费用包括模型调用Embeddings和文件数据存储两部分,收费价格分别为0.0005元/千tokens,以及每天每GB(千兆字节)内存1.5元。

王小川12月18日公开演讲中表示,上个时代的重要工具突破是“搜索引擎”,其作为人类文明的“载体”,成为信息时代的中心应用。而今天,ChatGPT等 AI 大模型所代表的是信息本身的收集和整理,并且在信息之上能产生知识。因此,基于基础大模型,未来大模型将分为三种发展模式:生产力提升、智能助理和开放世界,从而重塑现有行业以及创造全新价值。

“今年下半年之后(至今),我们看到的不再是一股脑地追最新的技术,而是大模型与现有搜索产品的结合,这种结合能够显著减少幻觉问题和时效性问题,从而实现更有潜力的一个应用。”王小川表示。

百川智能表示,目前,多个行业的头部企业已与百川智能达成合作,在深度融合百川智能的长上下文窗口和搜索增强知识库的能力基础上,对自身业务进行了智能化升级。

谈及更大参数模型是否开源,王小川对钛媒体App等表示,“从开源角度看,7B(70亿)、13B(130亿)这种参数模型比较合适的,未来可能会考虑把更大模型打开(开源),但在目前情况下,百川希望让‘这些企业最轻巧的能用(性能)最低GPU就能跑起来’。如果遇到复杂问题的时候,要么是自研,要么就交给百川来进行。”

王小川指出,“中国(大模型)现在总体分成三个阶段,第一阶段是恐慌期,OpenAI有了之后看中国公司还不行,数据飞轮美国先跑起来,是不是那个 AI 要来了,大家有这个探讨;第二阶段我做百川,大家开始火热地关注这件事;第三阶段,大模型学术进展是很快的,每天会有新的进展出来,技术人员每天都要跟进最新东西,不断迭代、不断改进,行业发展速度其实超出外界看法,目前需要快速迭代技术。”

王小川最近表示,百川智能在进行超级应用的探索。他期望在未来两年内,百川智能能证明大模型能够在健康、娱乐和创造上成为超级应用,带给人们像互联网时代那样的巨大帮助和希望。五年后,人们可能会有新的互动方式,比如拥有机器人、戴着VR眼镜以及每个人都有数字分身等。

“五年的时间太长,能够想到两年的画面,我就很满足了。”王小川表示。

王小川曾对外透露,预计明年一季度前后推出百川智能的“超级应用”。但钛媒体App问及目前“超级应用”进展情况和发布时间等问题,王小川未予回应。

“我觉得今天能做体量比较大的模型,还能做超级应用,这种公司最多5家。”王小川对钛媒体App等表示,“今年是中国 AI 大模型发展的元年,明年国内各家公司都会有相应的成绩出来。而今天,大家需要把精力放在模型本身,应用还处于初期状态,明年会差不多。”

(本文首发钛媒体App,作者|林志佳)

相关内容

热门资讯

一个提示攻破所有模型,Open... 新智元报道 编辑:peter东 犀牛 【新智元导读】 多年来,生成式AI供应商一直向公众保证,大语...
深圳市科达利取得盖板组件及电池... 金融界2025年5月15日消息,国家知识产权局信息显示,深圳市科达利实业股份有限公司取得一项名为“盖...
原创 千... 你可能以为千元机只是给爸妈用的“接电话神器”,或者学生党的“临时战备机”,但红米Turbo4 Pro...
“人工智能+”,山西怎么“+” “人工智能是年轻的事业,也是年轻人的事业”“推动我国人工智能朝着有益、安全、公平方向健康有序发展”…...
华为将推出鸿蒙折叠电脑 5月15日,第一财经获悉,在5月19日nova 14系列及鸿蒙电脑新品发布会上,华为将推出鸿蒙折叠电...
华为发布会将推出鸿蒙折叠电脑,... 5月15日,第一财经获悉,在5月19日nova 14系列及鸿蒙电脑新品发布会上,华为将推出鸿蒙折叠电...
香港故宫文博馆推出“‘纹’以载... 5月14日,在香港故宫文博馆,参观者在沉浸式体验数字化的故宫建筑、陶瓷、织绣等文物上的传统纹样。 5...
竹芒科技申请机器人送货专利,避... 金融界2025年5月15日消息,国家知识产权局信息显示,深圳竹芒科技有限公司申请一项名为“机器人送货...
博白:人工智能进校园 点燃学生... 5月12日,博白县人工智能社科普及进校园活动走进博白镇幼儿园,活动通过为小朋友展现科学原理,培育他们...
含硼聚乙烯板:科研机构的高效屏... 在现代科研领域,尤其是涉及核能、放射性物质等领域的研究中,中子屏蔽材料的重要性不言而喻。含硼聚乙烯板...
全车塑料,没有音响,这就是美国... 都说 3 万块的宏光 MINIEV 是给人民造车,那现在美国人民也有自己的宏光 MINIEV 了。 ...
蔡司智能玻璃新突破:车窗变身高... 蔡司公司在中国首次公开展示了其革命性的车辆智能玻璃方案,这一创新技术在近期举行的2025上海国际车展...
中国打造2800颗算力卫星天基... 北京时间2025年5月14日12时12分,国星宇航在酒泉卫星发射中心使用长征二号丁运载火箭,成功将太...
AI早报 | 腾讯高管称现有G... 腾讯高管称GPU够训练未来几代模型 5月14日,腾讯控股表示,AI能力已经对公司效果广告与长青游戏...
阿里巴巴开源视频生成与编辑模型... IT之家 5 月 14 日消息,据《科创板日报》报道,阿里巴巴正式开源通义万相 Wan2.1-VAC...
智能快车,出发向未来!2025... 智能时代到来,数字技术将如何撬动教育变革?5月14日,2025世界数字教育大会在湖北武汉开幕,教育数...
火星地下暗藏巨型液态水海洋,或... 一项震撼科学界的新发现揭示了火星可能隐藏着一个庞大的液态水海洋,这一发现彻底颠覆了我们对这颗红色星球...
腾讯研究院AI速递 20250... 生成式AI 一、 AI 笔记产品 Notion 今天发布了 3 个 AI 新功能All-In-One...
重庆力争农业生产信息化率202... 本报讯 (新重庆-重庆日报记者 赵伟平)5月14日,记者从2025年全市智慧农业现场推进会上获悉,我...
难怪现在小屏手机这么火 这几款... 【CNMO科技消息】在智能手机市场竞争日益激烈的当下,大屏手机曾一度占据主流,成为众多消费者的首选。...