华科大发布AI大模型猴子:部分超越GPT-4
创始人
2024-01-08 11:32:08
0

原标题:华科大发布AI大模型猴子:部分超越GPT-4

快科技12月12日消息,华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型“Monkey”。

该模型擅长图像描述和视觉问答,能够实现对世界的“观察”,对图片进行深入问答交流和精确描述。

官方介绍称,在18个数据集上的实验中,华科大Monkey模型表现出色,特别是在图像描述和视觉问答任务方面,超越了众多现有知名的模型如微软的LLAVA、谷歌的PALM-E、阿里的Mplug-owl等。

此外,Monkey在文本密集的问答任务中显示出显著的优势,甚至在某些样本上超越了业界公认的领先者GPT-4V。

Monkey的一个显著特点是其出色的“看图说话”能力。在详细描述任务中,Monkey展现了对图像细节的感知能力,能够察觉到其他多模态大模型所忽略的内容。

另一亮点是能够处理分辨率高达1344 x 896像素的图像,这是目前其他多模态大模型所能处理的最大尺寸的6倍。

据悉,目前业内能处理的图片最大分辨率为448×448像素。

值得一提的是,该团队已将Monkey代码在全球最大的代码托管服务平台GitHub上开源。

相关内容

热门资讯

比隐藏门把手还自作聪明的设计,... 原标题: 全网吐槽的反人类设计,车企这回听劝了 作者: 黑莓 似乎很少有人意识到,消失的实体键正悄悄...
原创 国... 2025年国产手机开始卷续航,电池大战已经开启,新发布的手机电池容量一台比一台大,普遍达到了7000...
选机如“开盲盒”?这四款新机终... 【CNMO科技导购】当代年轻人换手机,总在“性能狂飙”与“颜值正义”间反复横跳——既要游戏满帧不烫手...
何以九天揽星河 2025年3月21日19时左右,谷神星一号(遥十七)运载火箭顺利将6颗卫星送入535公里太阳同步轨道...
上海靓固取得一种摄像头装置专利... 金融界2025年5月10日消息,国家知识产权局信息显示,上海靓固智能科技股份有限公司取得一项名为“一...
赛力斯取得串型二级隔振悬置组件... 金融界2025年5月10日消息,国家知识产权局信息显示,赛力斯汽车有限公司取得一项名为“串型二级隔振...
浙江美声取得铭牌自动模切装置专... 金融界2025年5月10日消息,国家知识产权局信息显示,浙江美声智能系统有限公司取得一项名为“一种铭...
“科学的思想旅行”:《口述云南... 5月10日,一场以“科学的思想旅行”为主题的文化盛宴在昆明新华书店滇池书城拉开帷幕。由云南广播电视台...
山东安谱检测科技取得绿原酸楂物... 金融界2025年5月10日消息,国家知识产权局信息显示,山东安谱检测科技有限公司取得一项名为“一种绿...
下一代智能体如何跨界进化 想象未来某天,你的保姆机器人接到下楼买咖啡的指令,自主完成开门、乘坐电梯、寻找便利店、取咖啡、付钱等...
原创 为... 广告作为互联网行业最经典的流量变现方式,一直都是各类产品开启商业化的首选。诸如开屏广告、信息流广告、...
重磅!新型细胞技术“治愈”糖尿... 《科创板日报》5月11日讯(记者 徐红)新型干细胞技术“治愈”糖尿病。 自去年以来业界就不断有消息...
在轨53年,苏联时代废弃航天器... 俄罗斯国家航天集团10日说,在绕地轨道运行53年后,苏联时代发射、前往金星失败的航天器“宇宙482”...
原创 五... 2025年的智能手机市场,中端价位段(2000-4000元)竞争愈发白热化,不过随着旗舰技术下放、用...
河北石家庄:推进生物医药产业高... 中新网河北新闻5月11日电 (俱凝搏 韩晓欧)在河北省石家庄经济技术开发区,走进石家庄四药集团药物研...
多措并举点亮长效回馈星辰 深市... 本报记者 田鹏 在科技发展的漫漫长夜中,通信行业恰似那熠熠生辉的启明星,始终闪耀在时代前沿,以不断突...
原创 2... 2 月,全球新能源汽车市场延续了高速增长的态势,动力电池作为核心零部件的需求持续攀升。在这一背景下,...
英伟达首款ARM超级芯片GB1... 5 月 10 日消息,科技媒体 notebookcheck 昨日(5 月 9 日)发布博文,报道称英...
助力打造人工智能先锋城市 深圳... 深圳新闻网2025年5月11日讯(深圳商报首席记者 王海荣)2025年度深圳市训力券兑现申请已正式启...
“第三届未来口腔生物材料前沿论... “第三届未来口腔生物材料前沿论坛” 在西安成功举办 阳光讯 (记者 郑亚雷 )5月9—10日,由香港...