大模型开启新赛季,腾讯云存储升级:已有80%头部厂商采用
创始人
2024-04-08 19:58:22
0

原标题:大模型开启新赛季,腾讯云存储升级:已有80%头部厂商采用

图源:腾讯云官方

过去一年,大模型搅动全球科技圈。2024年初,Sora、Kimi等应用产品爆火,大模型迎来新一轮狂欢。

时代财经从腾讯云获悉,数据存储约占大模型训练整体工程量的20%-30%。AIGC相关应用持续爆发,数据存储的重要性正在逐渐凸显。

“训练数据是大模型云存储的重要步骤,云存储系统需要能够快速响应数据读写请求,提供低延迟、高吞吐量的存储服务。还要具备可扩容性和暂存能力,比如训练出现突发情况后,能在原有基础上重启继续训练。”某云厂商行业人员向时代财经表示。

4月8日,腾讯云宣布云存储解决方案面向AIGC场景全面升级,能够针对AI大模型数据采集清洗、训练、推理、数据治理全流程提供全面、高效的云存储支持。数据显示,采用腾讯云AIGC云存储解决方案,可将大模型的数据清洗和训练效率均提升一倍,需要的时间缩短一半。

AI大模型的研发生产流程主要分成数据采集与清洗、模型训练、推理三大环节,各环节都涉及海量的数据处理。在数据采集与清洗环节,由于原始训练数据规模海量,且来源多样,对存储技术提出了多协议支持、高性能、大带宽的需求。

腾讯云对象存储COS支持单集群管理百 EB 级别存储规模,提供便捷、高效的数据公网接入能力,并支持多种协议,充分支持大模型PB级别的海量数据采集。

在数据清洗环节,大数据引擎需要快速地读取并过滤出有效数据,COS通过自研数据加速器GooseFS提升数据访问性能,可实现高达数TBps的读取带宽,支撑计算高速运行,大大提升数据清洗效率。

在模型训练环节,通常需要每2-4小时保存一次训练成果,以便能在GPU故障时时能回滚,因此快速地读写checkpoint(检查点)文件也成了能否高效利用算力资源、提高训练效率的关键。

腾讯云自主研发并行文件存储CFS Turbo ,面向AIGC训练场景的进行了专门优化,每秒总读写吞吐达到TiB/s级别,每秒元数据性能高达百万OPS,均为业界第一。3TB checkpoint 写入时间从10分钟,缩短至10秒内,使大模型训练效率大幅提升。

大模型推理场景对数据安全与可追溯性提出更高要求。腾讯云数据万象CI为此提供图片隐式水印、AIGC内容审核、智能数据检索MetaInsight等能力,为数据生产从“用户输入——预处理——内容审核——版权保护——安全分发——信息检索”业务全流程提供有力支撑,优化AIGC内容生产与管理模式,顺应监管导向,拓宽存储边界。

同时,随着训练数据和推理数据的增长,需要提供低成本的存储能力,减少存储开销。对象存储服务提供了高达 12 个 9 的数据持久性和 99.995% 的数据可用性,能够为业务提供持续可用的存储服务。

在此之前,腾讯云已经面向AIGC场景推出了基于星脉网络的大模型训练集群HCC、向量数据库、以及行业大模型服务MaaS等大模型全链路云服务。

“稳定性、性能、性价比是大模型时代云存储的核心。”腾讯云智能存储总监叶嘉梁说道,他认为,腾讯云存储未来要做的是把数据的价值开放给客户,让客户能有效地利用好数据。

据今年1月国际调研机构沙利文联合头豹研究院发布的《2023年中国云存储解决方案》报告,腾讯云存储位居国内厂商第一位,获增长指数和创新指数双第一,入选中国云存储解决方案市场“领导者”阵营。

时代财经从腾讯方面获悉,目前已有80%的头部大模型企业选择腾讯云AIGC云存储解决方案,包括百川智能、智谱、元象等明星大模型企业。

相关内容

热门资讯

美媒:大脑芯片技术日渐成熟 参考消息网7月9日报道据美国石英财经网站7月7日报道,经过逾50年的研究,脑部植入技术已从实验室里的...
【特稿】美国教师要学AI 三大... 美国教师要学AI 三大美企联手培训 李贝阳 美国教师联合会8日在纽约市宣布,将与美国人工智能技术巨头...
黑林铺街道多社区联合开展红色阅... “没有共产党就没有新中国……”在黑林铺街道沙沟社区综合文化服务中心内,激昂嘹亮的歌声回荡,沙沟社区联...
山东恒亚申请车磨铣复合机床专利... 金融界2025年7月9日消息,国家知识产权局信息显示,山东恒亚机床制造有限公司申请一项名为“一种车磨...
原创 7... 月9日将成有史以来最短一天,科学奇观引发热议 在浩瀚的宇宙时间轴上,每一个瞬间都承载着独特的意义。而...
故宫博物院青少网站英文版、繁体... 故宫博物院青少网站英文版、繁体版上线暨2025年故宫-香港青年文化从业者“文化+科技训练营”开营仪式...
追火箭看排球听摇滚 文昌邀请各... 人民网海口7月9日电 (记者李学山)7月9日,由文昌市政府主办的“文昌是个好地方,邀您留一夏”202...
强化海洋战略科技力量 近日召开的中央财经委员会第六次会议提出,提高海洋科技自主创新能力,强化海洋战略科技力量。这有助于筑牢...
13.17秒跑完100米!全球... 7月7日消息,在浙江大学杭州国际科创中心(简称科创中心)首期开园五周年之际,科创中心人形机器人创新研...
飞书:发布多款AI产品,多行业... 【飞书召开AI产品发布会,发布升级多款产品助力企业AI落地】如今,AI大模型成不少人提效“神器”,但...
小红书不想只做一个「有用」的社... 文 | 阑夕 小红书的Slogan,变了。 从「你的生活指南」,改成了「你的生活兴趣社区」,虽然只是...
艾宝特智能取得电动直压开合模装... 金融界2025年7月8日消息,国家知识产权局信息显示,惠州市艾宝特智能科技股份有限公司取得一项名为“...
无人机“飞”进社区课堂 青少年... “机翼有正反,装反了小飞机可飞不起来哦!”在长安区太乙宫街道正街社区的活动室里,大学生志愿者正手把手...
贵阳这支算法团队,一年跻身西南... 日前,国际数据公司(IDC)最新报告显示,字节跳动旗下的豆包大模型在中国公有云大模型市场份额排名第一...
聚焦“天地一体”,中科曙光、中... 文 观察者网 武守哲 在全球空天竞争日趋激烈的背景下,7月8日,中科曙光与中科星图在合肥“2025空...
广州中慧上启科技靠谱吗? 在深化产教融合的国家战略推进中,广州中慧上启科技有限公司作为教育部备案的职业教育培训评价组织其教育软...
义乌太阳能风扇帽风靡海外市场 ... 央视网消息:随着全球多地气温持续走高,各类清凉小商品成为出口市场的爆款单品。截至7月初,这款走红海外...
济南园林集团与山东省互联网传媒... 记者 李萍 济南报道 7月9日,济南园林开发建设集团有限公司与山东省互联网传媒集团举行交流座谈会。济...
“本源悟空”引领:中国自主超导... 在科技领域,一场关于计算革命的新浪潮正在悄然兴起,其核心在于量子计算与人工智能的深度融合。这一趋势被...
漳州科华电气申请三电平变换器控... 金融界2025年7月9日消息,国家知识产权局信息显示,漳州科华电气技术有限公司申请一项名为“三电平变...