跟风“下云”?亚马逊云科技认为生成式AI更要上云!
创始人
2024-01-09 05:12:52
0

原标题:跟风“下云”?亚马逊云科技认为生成式AI更要上云!

2023年,以马斯克为代表的技术流正在掀起一波“下云”风潮。在马斯克的主导下,X(前身为Twitter)展开了大规模的“下云”工作:通过将工作负载从云端转移到自有服务器上,每月的云成本降低了60%,整体云数据存储量缩减了60%,云数据处理成本降低了75%。尽管X仍在使用少部分的公有云服务,但“下云”行动仍在云市场引起了讨论,支持和反对的声音充斥其中。

(亚马逊云科技大中华区产品部总经理陈晓建)

对于“下云”,亚马逊云科技是何观点呢?在2023年12月12日启动的亚马逊云科技2023 re:Invent中国行城市巡展北京站上,亚马逊云科技大中华区产品部总经理陈晓建表示,到底“上云”还是“下云”,这个问题本身没有标准答案,不同客户的诉求和能力不同,也将得出不同的解答。

“下云”即意味着要自建数据中心,特别是面对生成式AI的需求,这相当于要自建“摩天大楼”。那么究竟是自建“摩天大楼”还是租用写字楼,这是一个见仁见智的问题。过去的互联网应用,只需创建前端接入、配置数据库和数据存储等中间件和中间环境等,整个过程相对简单。而生成式AI要求懂大模型、理解分布式训练以及实现模型的安全共享等,这极大提升了对于IT人员的要求,还需要庞大的底层算力。

“以一千张GPU卡的并行训练为例,只有很少一部分客户具备这样的能力,更不用说实现极致的性价比”,陈晓建表示。亚马逊云科技作为全球第一大公有云服务商,已经实践了诸多超大规模计算场景,例如亚马逊云科技的Amazon Time Sync 服务结合了卫星与原子钟信息参照,可以在世界上任何地方提供几纳秒(十亿分之一秒)以内的同步时钟,并能够在Amazon EC2实例上以UTC微秒(百万分之一秒)为单位同步时间,并且通过一个标准48U机柜体积的分散式计时网络,可以实现超大规模服务器的时间同步。而生成式AI与企业业务的结合,就需要这样大规模、复杂的服务器时间同步能力,只有亚马逊云科技这样超大规模的云服务和研发团队,才能够实现超大规模计算场景。

众所周知,大模型和生成式AI是超大规模计算场景之一。亚马逊云科技为生成式AI提供三层架构,包括用于基础模型训练和推理的基础设施、使用基础模型进行构建的工具和利用基础模型构建的应用程序,并在每一层都持续创新,帮助客户轻松、安全地构建和应用生成式AI,进一步降低利用生成式AI的门槛。

芯片是超大规模计算的底层基础设施能力。在2023 re:Invent全球大会上,亚马逊云科技推出Amazon Graviton4和Amazon Trainium2自研芯片,为机器学习训练和生成式AI应用等广泛的工作负载提供更高性价比和能效。Graviton4与当前一代Graviton3处理器相比,性能提升高达30%,独立核心增加50%以上,内存带宽提升75%以上。Trainium2芯片专为以高性能训练具有数万亿个参数或变量的基础模型和大语言模型而构建,与第一代Trainium芯片相比,性能提升多达4倍,内存提升3倍,能源效率(每瓦性能)提升多达2倍。

而Amazon Bedrock发布了更多模型选择和全新功能,帮助企业安全构建和规模化生成式AI应用。来自Anthropic、Cohere、Meta、Stability AI和亚马逊最新的高性能模型为企业提供更丰富的模型选择,同时进一步降低了生成式AI应用的门槛,简化使用相关和专有数据定制模型的方式,提供自动执行复杂任务的工具,并提供了负责任构建和部署应用程序的保障。

最新推出生成式AI应用Amazon Q,可以根据企业业务进行定制,专门用于满足办公场景需要。Amazon Q是良好的基于生成式AI的助手,能够帮助各个行业、各种规模的企业安全地使用生成式AI。Amazon Q已提供预览版,Amazon Connect中的Amazon Q已正式推出,Amazon Supply Chain中的Amazon Q即将推出。

在大模型和生成式AI所需要的向量数据库方面,亚马逊云科技在2023 re:Invent全球大会上推出了Amazon OpenSearch Serverless向量引擎、Amazon DocumentDB和Amazon DynamoDB的新向量搜索功能、Amazon Memory DB for Redis向量搜索预览版,提升生成式AI应用在响应和延迟方面的性能表现,还正式推出图数据库分析引擎Amazon Neptune Analytics,帮助Snapchat这样的应用在几秒钟内对数十亿个连接进行图形分析。

陈晓建在亚马逊云科技2023 re:Invent中国行城市巡展北京站上强调,亚马逊云科技一直秉承逆向工作法(Working backwards)的理念,从数百万客户的需求出发构建产品,只有这样才能够持续引领科技创新。亚马逊云科技从未停止探索用各种方法、更优化方式找到解决客户痛点的最优解。直到今天,亚马逊云科技仍然拥有业界最广泛、最深入的功能。

相信在生成式AI时代,“上云”仍然是企业数字化转型的最优路径之一,而只有深入用云、基于云原生开发和部署企业应用,企业才能真正享受云计算的红利,才会对“上云”或“下云”得出自己的答案。(文/宁川)

相关内容

热门资讯

全国首单!低空检测设备保险在渝... 5月24日,上游新闻记者获悉,全国首单低空航空器机载检测设备损失补偿保险同时在重庆、雄安两地落地,为...
科普建筑的“阿鹏哥哥”:做沉淀... 新华社北京5月23日电 5月23日,《新华每日电讯》发表题为《科普建筑的“阿鹏哥哥”:做沉淀下来播撒...
鸟类声纹识别系统 鸟类鸣声数据... 鸟类声纹识别系统背景 生物多样性是人类生存和社会发展的基础,是生态文明建设和民族永续发展的保障;生物...
甲骨文400亿美元购英伟达芯片... 【5000 亿美元“星际之门”项目首站:甲骨文 400 亿美元助力 OpenAI 打造全球最大 AI...
传统与现代辉映 科技与文化交融... 来源:光明网-《光明日报》 “今年文博会上,咖啡师都变机器人啦!不但能现磨咖啡豆,还能做手冲、拉花咖...
驼峰500HS全球首发,获30... 重庆驼航科技在第十届深圳国际无人机展览会上,以“驼峰,特种低空物流先锋”为主题,完成驼峰500HS纵...
山西征集申报2025年度国家科... 5月20日,省科技厅下发通知,征集申报2025年度国家科学技术奖项目(人选)。 征集奖种为: 国家最...
原创 全... 2021年,全球首个活体机器人成功“生娃”,这一突破性的科研成果引发了广泛关注,人们惊叹于科技的飞速...
特朗普AI顾问叫嚣:荷兰继续对... 据路透社报道,当地时间5月23日,白宫人工智能和加密货币事务负责人戴维·萨克斯叫嚣,限制向中国出售极...
AI隐私风暴升级 智谱清言、K... 《科创板日报》5月22日讯(记者 李明明 黄心怡)热门AI应用再卷入隐私安全风暴。 国家网络与信息安...
原创 A... 在人工智能加速重构商业格局的关键节点,山东正和岛于5月14日成功举办 AI 先锋大课。此次大课以 《...
极为罕见!中国天眼有重要发现 日前,中国科学院国家天文台韩金林研究员带领团队利用中国天眼FAST发现了一个罕见的毫秒脉冲星,与伴星...
小米汽车回应YU7门把手冬天冰... 【CNMO科技消息】近日,随着小米YU7热度不断攀升,消费者对其在极寒天气下的使用表现,尤其是门把手...
晶合集成获得发明专利授权:“半... 证券之星消息,根据天眼查APP数据显示晶合集成(688249)新获得一项发明专利授权,专利名为“半导...
龙腾光电获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示龙腾光电(688055)新获得一项实用新型专利授权,专利名为“...
珠海超俊科技取得显影件和显影盒... 金融界2025年5月23日消息,国家知识产权局信息显示,珠海超俊科技有限公司取得一项名为“显影件和显...
Meta:2025年Meta ... 今天分享的是:Meta:2025年Meta Al移动应用出海增长白皮书 报告共计:112页 《202...
华沿S50大负载机器人在深发布 深圳商报•读创客户端 记者 潘文婷 5月23日,华沿机器人“共铸华章·沿创未来”全球合作伙伴大会在深...
原创 华... 5月24日知名数据调研公司Counterpoint对2025年第一季度国内智能手机市场进行了一个简单...
如何看待ARM官网上显示小米玄... 从技术合作的角度来看,ARM官网内容引发争议的核心在于对“定制”概念的理解差异。根据搜索结果,ARM...