2024世界人工智能大会 | “百模大战”如何突围?这两家上海AI企业有自己的思考
创始人
2024-06-21 13:00:44
0

图说:星环科技大厅展示的数据+AI基础设施产品魔方 新民晚报记者 陶磊 摄(下同)

7月初,2024世界人工智能大会又将如约在上海拉开大幕。不用说,今年的关键词一定是“大模型”。据介绍,目前全市已有34款大模型通过备案,产生了制造业、金融、具身智能机器人等垂类领域应用。

20日,记者跟随大会主办方走进两家人工智能头部企业,一探大模型的行业现状。

把大模型训练成“理科生”

星环科技致力于打造企业级大数据与人工智能基础软件,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件产品,构建明日数据世界。“大模型相关技术已融入企业生产经营的方方面面。”星环科技创始人、CEO孙元浩指出,“大模型主要优势是提供了自然语言理解能力,还有简单的推理能力,并能在个人指导下调动工具。”

孙元浩说,目前来看,大模型落地过程中遇到了很多挑战,今年以来大家开始理性看待大模型具体能带来什么,“在大模型落地过程中,逐渐显现出一些难点,如技术执行、实施成本、相关技术人才的缺乏、生成式人工智能的治理、数据可用性等等。”

图说:工作人员演示星环科技大模型产品

立足于大数据基础软件优势,星环科技是国内第一批推出自研大模型的软件信息公司。早在2023年5月,公司就推出了业界首创的金融大模型“无涯”,以及大数据分析大模型SoLar“求索”。在孙元浩看来,当下众多AI大模型更像“文科生”,而星环科技的目标是将大模型训练成“理科生”,能够进行数学分析,懂得自然科学的各个学科,从而解决企业运营过程中的实际问题。

就在不久前,星环科技推出了“问知”AIPC版,它支持多格式、不限长度的文件资料入库,还支持影、音、图、文等多模态数据的“知识化”处理,以及“语义化”查询和应用能力。值得关注的是,这是一款为个人用户设计的大模型应用产品,可以在配备Intel新一代CPU的主流个人电脑上,基于集成显卡和NPU流畅运行。

“模型的建构和人的发展有诸多相似之处。一个人很难熟知所有科学知识,这就需要不同领域的专家,专业模型亦是如此。”孙元浩告诉记者,“星环科技通过收窄模型的应用领域,训练出不同垂类的专业模型,然后将这些专业模型组合成大模型。这在保证模型专业度的同时,大大降低了模型的训练代价和推理代价。”

坚信Scaling Law 选择“厚积薄发”

阶跃星辰是一家通用大模型创业公司,自成立起在算力、系统、数据和算法这四大要素上综合布局,已对外发布Step系列大模型;同时,通过自有产品和合作产品两种方式探索C端应用,已推出的产品包括个人效率助手“跃问”和 AI 开放世界平台“冒泡鸭”。

图说:阶跃星辰展厅展示的文生广告图

“GPT-4有万亿参数,而人脑的神经元连接是200万亿。”阶跃星辰系统负责人朱亦博博士打比方说,这家坐落于徐汇西岸智塔的初创公司信仰Scaling Law(规模法则),认为在肉眼可见的未来,至少还有十万亿和百万亿两个数量级的大模型。面对喧嚣的“百模大战”,阶跃星辰选择了“厚积薄发”,朱亦博说,攀登Scaling Law的巅峰,毕竟是一个包含算力、系统、数据和算法的“铁人四项”超级工程。

低调了近一年,阶跃星辰在今年三月“初露锋芒”——发布Step系列大模型,包含了Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE(混合专家架构)语言大模型预览版。“Step-1V一经发布便登上了权威大模型评测平台‘司南’的多模态大模型3月榜榜首。”朱亦博介绍,“Step-1V的多模理解能力突出,可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。”

阶跃星辰的研发团队觉得,通用大模型未来还能走得更远,“模型要大,多模态理解和生成的统一是通往AGI的必经之路。”作为一家初创公司,阶跃星辰也很务实,会大方地承认“还在追赶GPT-4”。“OpenAI发布的模型在不断迭代,我们现在的模型也还在打磨。希望不久的将来,能有对标GPT-4的水平。”朱亦博坦言。

图说:阶跃星辰工作人员介绍AI智能助手“跃问”

朱亦博告诉记者,如果大语言模型要上万亿参数,MoE架构可以说是最优解,“MoE是在性能、参数量、训练成本、推理成本这些维度权衡下的最佳选择。”

值得一提的是,阶跃星辰Step系列通用大模型凭借其技术创新和广泛的落地应用,已经成功入选2024世界人工智能大会SAIL奖30强榜单。阶跃星辰基于Step系列大模型推出了一款个人效率助手“跃问”,在本届世界人工智能大会上也会带来最新的产品功能体验。

新民晚报记者 郜阳

相关内容

热门资讯

松延动力获得自由体操冠军 姜哲... 人形机器人进行自由体操比赛。主办方供图 新京报贝壳财经讯(记者陈维城)8月16日,在2025世界人形...
第三届全国人工智能应用场景创新... 依托高校项目团队,辅助诊断疑难脑肿瘤病例1000余例;依托冰箱制造基地,建立食材数据库,形成百万级别...
助力航天员出舱任务 我国空间站... 据中国载人航天工程办公室消息,北京时间2025年8月15日22时47分,经过约6.5小时的出舱活动,...
天利智能公布“一种灵敏度高的核... 天眼查APP显示,近日,常州天利智能控制股份有限公司申请的“一种灵敏度高的核级温度开关”专利公布。 ...
控汇股份公布“一种高效散热工控... 天眼查APP显示,近日,深圳市控汇智能股份有限公司申请的“一种高效散热工控机及其外壳结构”专利公布。...
文化数据数纽中心成立!上海数交... 8月14日,上海数据交易所与中漫蓝犀(北京)数字科技有限公司联合成立的文化数据数纽中心在浦东揭牌成立...
新一代智己LS6重磅发布,以“... 8月15日,超级大五座智能SUV——新一代智己LS6正式开启预售,重磅推出超级增程和纯电双动力版本。...
原创 当... 当中国亚轨道火箭在黄海平台上稳稳落下时,这场看似低调的海上回收试验,实则是中国在太空棋盘上落下的一枚...
苹果手游云设备:哪个云手机流畅... ## 一、当硬件不再成为桎梏:云手机如何重塑游戏体验? 作为手游深度玩家,我曾无数次被发烫的机身...
走进深蓝|何谓“一水八用”? 齐鲁网·闪电新闻8月16日讯多年来,山东海化集团始终在技术创新上不断突破,其中“一水八用”循环体系,...
誉辰智能获得发明专利授权:“电... 证券之星消息,根据天眼查APP数据显示誉辰智能(688638)新获得一项发明专利授权,专利名为“电芯...
成都首个光伏科技馆亮相 带你沉... 光伏科技馆展区一角。 8月14日,记者了解到,近日成都首个光伏科技馆——通威光伏科技馆正式亮相。该馆...
AI推理工厂利润惊人!英伟达华... 在人工智能领域的激烈竞争中,AI推理业务正展现出惊人的盈利能力。摩根士丹利近期发布的一份深度报告,通...
原创 中... 前言 随着我国航空产业的快速发展,退役大飞机的拆解问题逐渐浮出水面。 很多人可能不知道,许多退役的...
果蔬行业新变革:橙购优选探索互... 在当今全球化的时代,一张由现代物流网络编织而成的隐形巨网,已将世界各地的美味紧密相连。从智利的鲜甜车...
公元股份“一种带开关功能的管道... 天眼查APP显示,近日,公元股份有限公司申请的“一种带开关功能的管道开孔工具”专利获授权。摘要显示,...
15年深耕+4大硬核工具!EX... 作者:EXERA ENERGÍA S.L. 运维总监 Raúl Mendoza(劳尔•门多萨) ...
充电宝新规实施首日,部分商家紧... 在售充电宝绝大多数已获3C认证 时代周报记者/摄 8月15日,是《强制性产品认证实施规则 移动电源...
【产业链上的山东好品牌】菏泽市... 菏泽同华环保有限公司是山东省菏泽市牡丹区引进的科技型企业之一,主要从事餐厨废弃物的收运处理。公司通过...
2025最建议买的手机!新学期... 2025最建议买的手机!新学期开学季性价比最好的三款手机推荐! 暑假来临,到了很多学生换手机的最佳...