碾压ChatGPT,地表最强AI大模型来了!一口气读15万英文单词,谷歌和亚马逊投资
创始人
2024-03-06 21:45:00
0

原标题:碾压ChatGPT,地表最强AI大模型来了!一口气读15万英文单词,谷歌和亚马逊投资

最近,人工智能大模型初创公司Anthropic发布了Claude 3系列AI模型。根据基准测试结果,Claude 3在各项指标上全面超越了ChatGPT-4。圈内不少人士评价,Claude 3再一次刷新了会话式人工智能的新高度。

Anthropic是OpenAI的强劲对手,其创始团队成员就是从OpenAI出走的技术人员。而这家大模型初创公司的背后,站着的是谷歌和亚马逊这两大科技巨头。风起云涌的大模型世界中,受微软支持的OpenAI目前在商业化探索中遥遥领先,但在捍卫技术先进性方面压力并不小。

地表最强AI大模型易主

Claude 3 AI系列模型有三个,按能力由弱到强排列分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。其中,性能最强的Opus在基准测试的多个核心指标上都全面超越了ChatGPT-4和谷歌的Gemini 1.0 Ultra,荣登目前的AI大模型榜单榜首。

根据Anthropic的介绍,Opus拥有人类本科生水平的知识,在复杂任务上表现出接近人类水平的理解力和流利性。同时,所有Claude 3模型在分析预测、内容创建、代码生成以及西班牙语、日语和法语等非英语语言的对话方面都显示出更强的能力。

综合来看,Claude 3具有以下几个亮点:

一是“记忆力”超群,支持超长文本。Claude 3系列模型在发布时最初将提供200K上下文窗口,并且能够准确回忆大量数据中的信息。200K上下文对话长度,相当于15万英文单词,而此前OpenAI发布的GPT-4 Turbo,可支持的上下文窗口为128K。业内人士分析,长文本的优势让Claude可以在读论文、写小说等涉及字数更多的任务上,更擅长理解和回答用户的问题。

二是多模态能力强,视觉能力突出。据介绍,Claude 3具有与其他领先模型相媲美的复杂视觉能力,可以处理各种视觉格式,包括照片、图表、图形和技术图解。根据网友测评,Claude 3允许用户上传图像和其他文档,能够“认”出和描述图里的内容,回答用户的问题。

三是兼顾安全性与易用性。Claude模型一直被视为“最安全”的模型,致力于降低虚假信息、隐私泄露等方面的风险。不过,此前的Claude 2.1和Claude 2.0曾因为过于“道德”和“守法”,受到了用户的质疑和吐槽。不少人抱怨,Claude像一个难以沟通的“老顽固”,无论是请求帮忙起草文件、完成翻译任务,Claude总是能找到各种理由拒绝执行。

在一些用户看来,Anthropic为了追求安全而牺牲了模型的性能,带来诸多不便,导致使用体验不佳,不少人就表示将取消订阅Claude 2.1或Claude 2.0,转而使用ChatGPT或其他竞品。

更新的Claude 3依然十分重视安全性,但也在易用好用方面进行了优化,拒绝回答无害问题的频率要低得多。据Anthropic介绍,与前几代模型相比,Opus、Sonnet和Haiku拒绝回答的可能性要小得多,显示出对用户请求更细致的理解,能够识别出真正的危害。

国海证券研报表示,“我们认为Claude 3对幻觉问题的处理方式可能成为或已成为行业共识,即如何平衡模型过度保守(拒绝回答某些问题)和正确回答问题而非“不懂装懂”的两种倾向。

在Anthropic发布Claude 3以后,许多科技圈人士都在喊话OpenAI,在线“催更”,表示期待GPT-4.5或者GPT-5的问世。不过,去年6月,OpenAI CEO山姆·奥特曼就曾公开表示,“我们可能会尝试按顺序推出GPT-5模型,但不会很快”。目前,OpenAI更受到外界关注的产品是其2月发布的文生视频模型Sora。

目前Claude 3成功登顶AI大模型榜单的榜首,但在飞速进化的大模型技术浪潮下,地表最强AI大模型的桂冠在未来恐怕也将频繁易主。

硅谷大模型之争的两大阵营

Anthropic是什么来头?

事实上,这是一家成立时间只有3年左右的年轻公司,其两位创始人Dario Amodei和Daniela Amodei都是OpenAI的前员工,离职前分别担任OpenAI的研究部门副总裁和安全与策略部门副总监。据外媒报道,Dario Amodei离职创业时,还挖走了十几名OpenAI的员工,其中就包括GPT-3首席工程师Tom Brown。

值得注意的是,Dario Amodei和Daniela Amodei之所以选择自己出来做大模型,正是因为对OpenAI在技术还不够安全的情况下就快速商业化感到不满,其愿景是构建可靠的、可解释的、可操控的AI系统,首要目标就是AI安全。这便也能够理解,为什么Claude系列模型如此重视安全性。

与OpenAI主要依赖微软为其提供资金支持不同,Anthropic背后站着谷歌、亚马逊、Salesforce、高通、韩国电信等多个投资方。亚马逊在投资的同时,还成为了Anthropic主要的云计算提供商。Anthropic也成为了全球最“吸金”的大模型创业公司之一,仅在2023年,Anthropic就完成了5轮融资,获得了共计73亿美元的融资。

OpenAI由于背靠金主微软,与其他的硅谷科技巨头及它们所支持的大模型初创公司形成了明显的两大阵营。Anthropic无疑是其中最能够与OpenAI叫板和分庭抗礼的一家公司。一名业内人士分析,Anthropic的核心成员正是最初做出了GPT-2、GPT-3的人,团队的研究能力很强。在OpenAI发布ChatGPT以前,Anthropic其实就已经做出了Claude产品,“两个团队的技术能力不相上下”。

不过虽然OpenAI和Anthropic在技术的较量上十分焦灼,但是在商业化能力方面,OpenAI则要明显领先于Anthropic。据The Information报道,截至去年年底,OpenAI的年化收入已经达到16亿美元,管理层预计到2024年底年化收入可达50亿美元。但是,Anthropic预计到2024年底的年化收入仅仅为8.5亿美元。

不过值得注意的是,OpenAI和Anthropic在商业化路线上有比较明显的差异。与OpenAI面向C端用户推出产品相比,Anthropic对B端客户似乎更感兴趣。Anthropic联合创始人此前在接受福布斯采访时表示,Anthropic更像是一家企业公司,而非消费者公司。

目前,已有多家知名企业基于Anthropic模型开发了产品,例如,著名资产管理公司Bridgewater Associates基于Anthropic模型,开发了一款用于自动生成图表、财务数据、总结财务摘要的AI助手。而Anthropic其他的B端客户,还包括Gitlab、Notion、Salesforce等公司。

责编:岳亚楠

校对:王朝全

相关内容

热门资讯

英伟达刷新历史新高!黄仁勋:又... 【大河财立方消息】当地时间6月25日,美股三大指数涨跌不一。道指跌0.25%,报42982.43点;...
全新小米AI眼镜官宣:面向下一... 6月25日,小米官方微博宣布,将于26日晚7点发布的“面向下一代的个人智能设备”为小米AI眼镜。 ...
靠县城中产,零跑能迈过50万生... 「核心提示」 零跑的领跑会是昙花一现吗? 作者 | 朱晓宇 编辑 | 邢昀 曾经摸着理想过河...
Windows 11启动音效意... 2025-06-25 11:41:41 作者:狼叫兽 近期,有用户在测试Windows 11预览版...
机械四院等取得一种压型外墙板专... 金融界2025年6月25日消息,国家知识产权局信息显示,机械工业第四设计研究院有限公司、中国汽车工业...
黄仁勋:机器人技术是英伟达下一... 财联社6月26日讯(编辑 牛占林)当地时间周三,英伟达首席执行官黄仁勋表示,除了人工智能(AI)之外...
夏季达沃斯“开席”,天津上“硬... 一提到夏季达沃斯论坛,人们就会想到一个网络热词“高端大气上档次”。今年的这场高端盛宴中,飘来一股独特...
建湖:税惠助力机器人产业“加速... 走进工厂生产车间,智能化生产线让人眼前一亮,机械臂在空中精准地挥舞,将一个个零部件巧妙地组装成完整的...
EB病毒感染细胞“通用钥匙”发... 科技日报广州6月25日电 (记者叶青)记者25日从中山大学肿瘤防治中心获悉,该中心曾木圣、钟茜教授团...
小米YU7比SU7贵2-3万元... 小米将于 6 月 26 日(本周四)晚 7 点举办新品发布会,届时 YU7 将正式发布并上市。 今天...
OpenAI:研发办公套件或挑... 【6月25日消息,OpenAI正研发办公套件挑战微软】OpenAI正在研发一款办公套件,具备文档协作...
科普|方还是圆 文化环境影响“... 本文转自【新华社】 新华社华盛顿6月24日电 我们所看见的世界,不一定只是视觉细胞对外界的客观反映,...
徐州天能申请全自动轮毂输送线专... 金融界2025年6月25日消息,国家知识产权局信息显示,徐州天能金属科技有限公司申请一项名为“一种全...
武汉经开区:AI点燃孩子的科创... 中国教育报-中国教育新闻网讯(记者 程墨 通讯员 孙怡荣 马欣欣)“报告老师,火星救援车智驾测试一切...
越南青年“红色研学之旅”之华电... 近日,由共青团中央指导、中国华电集团有限公司主办的越南青年“红色研学之旅”之华电研学营开营仪式在中国...
明阳智能:定制化风电方案赋能北... 近期,明阳集团携手内蒙古风电装备产业促进会在包头市共同举办了2025年内蒙古(包头)风电产业链建设大...
深圳镭赫技术取得检测设备专利,... 金融界2025年6月25日消息,国家知识产权局信息显示,深圳镭赫技术有限公司取得一项名为“检测设备”...
苏州富强科技取得M袋上料装置专... 金融界2025年6月25日消息,国家知识产权局信息显示,苏州富强科技有限公司取得一项名为“M袋的上料...
大疆无人机美国缺货引发猜测,官... 2025-06-25 11:21:29 作者:狼叫兽 6月25日,据相关媒体报道,大疆创新旗下的...
断网孤岛架起“信息天路”!北京... 当突发汛情状况威胁通信生命线,谁能守护首都信息畅通?6月20日,一场全要素防汛演练在北京房山区十渡镇...