谷歌重磅发布新一代开源AI大模型,称其性能在同等规模中最为先进!
创始人
2024-02-22 10:47:58
0

原标题:谷歌重磅发布新一代开源AI大模型,称其性能在同等规模中最为先进!

每经编辑:杜宇

开源领域大模型,迎来了重磅新玩家。

当地时间周三(2月21日),科技巨头谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral 7B。

谷歌官网写道,Gemma在拉丁语中意为“宝石”,以此命名的开放模型系列Gemma由Google DeepMind等团队开发,采用了与创建Gemini模型相同的研究和技术。

目前,Gemma系列有两种权重规模的模型,分别为“Gemma 2B”和“Gemma 7B”,即20亿参数和70亿参数,以满足开发人员的不同需求。

在性能方面,官方页面显示,Gemma 7B在MMLU(大规模多任务语言理解)的得分率达到64.3%。在同等规模中,原本最强Mistral 7B的得分率为62.5%,Meta的Llama-2 7B和13B也都与其有一定的差距。

Gemma也第一时间上线了 HuggingFace 和 HuggingChat,每个人都能试一下它的生成能力:

在Hugging Face的LLM leaderboard集中式排行榜上,Gemma的2B和7B模型的平均得分也位于各自参数规模的榜单前列。

谷歌在新闻稿中写道,Gemma 2B和7B与其他开放模型相比,展现出在同等参数规模中最先进的性能,甚至超过了一些更大的模型,这得益于与公司最强的AI模型Gemini共享技术和基础架构。

软件工程师Jeff dean称,尽管体量较小,但Gemma模型已经在关键基准测试中明显超越了更大的模型,对比的包括Llama-2 7B和13B,以及风头正劲的Mistral 7B。

而且Gemma能够直接在开发人员的笔记本电脑或台式电脑上运行。除了轻量级模型之外,谷歌还推出了鼓励协作的工具以及负责任地使用这些模型的指南。

Keras作者François Chollet对此直接表示:最强开源大模型的位置现在易主了。

谷歌和Alphabet公司CEO 桑达尔·皮查伊(Sundar Pichai)表示,Gemma展示了强大的性能,从今天开始,该模型将在全球范围内提供,并可在笔记本电脑、工作站或谷歌云上运行。

Google DeepMind CEO Demis Hassabis表示,轻量开源的Gemma是同类尺寸中性能最佳的模型。

如今,谷歌不仅将对手瞄向OpenAI,而且打算占据一切,新模型将比扎克伯格的Llama-2“遥遥领先”。

谷歌计划未来推出更多的Gemma变体,以适应更广泛的应用场景。目前,想要开始使用这些模型的开发者可以通过数据科学平台Kaggle、谷歌的Colab笔记本或通过谷歌云进行访问。

每日经济新闻综合谷歌官网、公开资料

每日经济新闻

相关内容

热门资讯

英国研发新型机器人皮肤   新华社北京6月21日电 英国研究人员近期研发出一种由柔软且低成本的凝胶材料制成的新型机器人皮肤,...
人工智能赋能电网,杭州电力正打... 潮新闻客户端 记者 施雄风 通讯员 富岑滢 屠永伟 6月20日,2025国家能源互联网大会在杭州开幕...
一线调研丨自主创新 城市“充电... 如今,风电、光伏发电增长迅速,但却是“靠天吃饭”,具有波动性、随机性和间歇性,无法做到随用随发,因此...
泰波尔生物取得胆酸层析分离装置... 金融界2025年6月21日消息,国家知识产权局信息显示,四川省泰波尔生物科技有限公司取得一项名为“胆...
国家药监局:支持高端医疗器械创... 转自:证券时报 人民财讯6月20日电,国家药监局今天(6月20日)审议通过《关于优化全生命周期监管支...
Anthropic警告:包括C... 6 月 21 日消息,据外媒 TechCrunch 今日报道,在数周前发布研究指出其 Claude ...
跨境支付通明日上线,内地香港居... 跨境支付通将于6月22日正式上线,这是一项旨在提升内地与香港跨境支付效率和便利性的创新服务。通过跨境...
GenLayer推出AI与区块... GenLayer是一家专注于为AI和机器代理构建去中心化法律基础设施的初创公司,近日推出了其首个激励...
数智赋能,温暖万家:浙江省妇联... 为积极拥抱人工智能技术浪潮,充分发挥妇联组织立足家庭阵地推动科技创新和产业创新深度融合的独特作用,助...
腾讯云:2025年DeepSe... 今天分享的是:腾讯云:2025年DeepSeek崛起与运营商智能化跃迁报告 报告共计:21页 腾讯云...
智慧教育元年 数字化打开课堂新... 2025年,智慧教育元年 数字化打开课堂新空间(大数据观察) 体验卫星仿真教学系统,使用智慧纸笔书写...
中外专家探讨AI前景:机遇与挑... 新疆克拉玛依6月20日电(苟继鹏)人工智能(AI)已深度融入城市治理,AI加速云计算技术迭代升级,A...
探访中关村两院:超常规育人模式... 超常规速度建设、设置“天偏怪才”赛道、8小时前沿短课……在海淀大悦信息科技园,刚刚成立的北京中关村学...
AI说:“安逸四川.爽在宝山” 韩江 (培训班现场) 为学习贯彻四川省委十二届七次全会精神,全力打造“锦绣天府.安逸四川”文旅品牌...
我国科研团队成功研制高分辨率触... 图为机器人仿生手感知区域图解。赵秭杭 李宇飏制图 北京通用人工智能研究院的实验室里,一只机器人仿生手...
【聚焦】渤海湾畔,一场“脑机森... “我2005年开始从事脑机接口的课题研究,算算至今正好20年了,最近两三年里脑机产业在天津高新区发展...
图片界的王者Midjourne... 最近的AI视频圈,似乎热闹起来了。 自从谷歌上个月放了波叫Veo3的大招,各大同行好像也加快脚步了,...
浙江新控电气取得接触器行程开关... 金融界2025年6月21日消息,国家知识产权局信息显示,浙江新控电气科技有限公司取得一项名为“一种接...
格力电器获得发明专利授权:“语... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“语音...
小心!这些办公“黑科技”可能有... 网络视频会议系统可以为用户提供稳定可靠的图像、语音,更便捷地完成数据信息实时交互,在节约成本的同时大...