生成式AI如何跨越应用落地“鸿沟”?
创始人
2024-04-15 10:26:30
0

原标题:生成式AI如何跨越应用落地“鸿沟”?

前不久,亚马逊云科技投资的Anthropic发布了模型Claude3,并且第一时间在Amazon Bedrock平台上完成了发布。Anthropic做出长期承诺,将通过Amazon Bedrock为世界各地的亚马逊云科技用户提供访问其下一代基础模型的能力。在日前的生成式AI沟通会上,亚马逊云科技方面演示了Claude3的能力;并且再次阐释了如何将大模型能力提供给千行百业的用户,Amazon Bedrock是其中一分部。

Amazon Bedrock 是一项完全托管的服务,通过单个 API 提供来自 AI21 Labs、Cohere、Meta、Stability AI和Amazon Titan等领先人工智能公司的高性能基础模型,以及通过安全性、隐私性和负责任的 AI 构建生成式人工智能应用程序所需的一系列广泛功能。

当前企业对大模型的重视,与多年前对云的接受类似,为了降本增效、激发创新。即便是在这个“数字化生存”加速展开的时代,企业上云,从外驱到自发,依旧用了超过十年时间。相较之下,大模型与生成式AI的应用,在相当数量的企业被迅速提上日程,算是个小小的“奇迹”。当然,快速跟进之下,痛点同样突出:从模型能力的获得到对运营生产生成真实驱动力之间,存在不小的“鸿沟”。

帮助企业在大模型层面“跨越鸿沟”,这是亚马逊云科技作为云服务探路者驱策数字生产力之后,想做的又一件事。

去年6月的“2023亚马逊云科技中国峰会”,大模型、生成式AI、AI创新,是贯穿议程的线索。也就是从2023年下半年开始,从外部观察,亚马逊云科技对AI的重视程度达到了空前高度,除了成立生成式AI创新中心、投资模型公司Anthropic、强化和开放自家模型Amazon Titan、丰富相关服务架构外,与其他模型公司的合作也在深化。

今年来看,亚马逊云科技的发展重心,很大程度上还会在大模型与生成式AI上。

Claude 3强势登陆Bedrock

Claude 3作为当前全球最领先的大模型之一,不同于某些语言模型或者视觉模型等等,主打“多模态”,这也是大模型本身发展的趋向。系列包括Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku,被亚马逊云科技形象地称之为“超大杯”“大杯”“中杯”,分别指向高度复杂任务、在技能与速度之间达到理想平衡、几乎即时响应且最紧凑,供客户根据自己的商业需求,从中选择适合的智能、速度和价格组合。

Claude3系列模型提供200k长度的上下文召回,并针对不同的用例进行了优化。Opus具有深度推理、高级数学和编码能力,在高度复杂的任务上具有顶级性能;Sonnet适用于绝大多数工作负载;Haiku突出快速、紧凑,几乎及时响应,成本相对平易。

基准性能来看,据称Claude 3创造了模型智能水平新纪录,在数学问题、编程练习和科学推理等标准评估中超越了所有现有模型,特别是Opus,不仅在包括本科生水平专业知识(MMLU)、研究生水平专业推理(GPQA)、基础数学(GSM8K)在内的常见AI系统评估基准测试中表现优异,在复杂任务中也表现出了优秀的理解能力和流畅性。

多模态能力来看,Claude 3可以接受基于图像的输入,能力与其他前沿模型大致相同,且延迟低于其他多模态模型,在兼具速度和智能要求的用例中表现出色。

AI幻觉来看,Claude 3在处理挑战性开放问题上准确性相较Claude 2有着明显的提升,从举例上看,Claude 3对于不明确的问题会表示并不足够了解,Claude 2可能会出现“放飞自我”自由表达的情况。

应用场景来看,Claude 3可提供包括内容续写、代码辅助、电商商品描述撰写以及长文本知识召回在内的多种功能。

现场演示来看,亚马逊云科技主要展示了Haiku,部分展示了Sonnet,Haiku在即时性出色的前提下,输出结果的素质也有保障;Sonnet的输出结果显然更出色,或许可以理解为职业头显中加“高级”与否的差别。

Amazon Bedrock不止对接领先模型

对Amazon Bedrock的能力,亚马逊云科技方面也进行了一次全新解读,除了提供对全球领先基础模型的接入,其还提供知识库、代理等各种便捷工具,同时确保数据隐私和安全,助力企业构建和应用生成式AI。

知识库功能 Knowledge Bases for Amazon Bedrock,为基础模型和Agent提供来自企业私人数据源的上下文信息,用于检索增强生成 (RAG),以提供更相关、更准确和更个性化的响应。

代理功能 Agents for Amazon Bedrock,使生成式 AI 应用能够使用自然语言来执行多步骤的业务任务。如果需要用户输入特定信息,Agent会主动询问,用自然语言获取所需的附加细节。最重要的是,Agent始终利用最新的信息,并在保证安全与隐私的前提下为用户提供解决方案。

加速实现负责任AI的Guardrails for Amazon Bedrock,允许客户根据应用程序特定要求和负责任的 AI策略来管理用户体验。构建适合其应用场景且符合其安全和隐私要求的生成式人工智能应用程序,能够为Amazon Bedrock上的多种基础模型和代理提供保护;根据用户设置的负责任AI策略来配置有害内容过滤器;能够通过简短的自然语言描述来定义并拒绝生成被禁止的话题;能够在基础模型的回复结果中屏幕个人隐私数据。

合规方面,Amazon Bedrock是基于全面的数据保护和隐私保护构建的,传输中数据和静态数据都会被加密,数据不会与模型提供者共享,也不会用于改进基础模型。

支持构建生成式AI的三层架构

亚马逊云科技与众多客户开展了生成式AI合作过程中发现,各行各业的场景千变万化,即使单一大模型的技术能力再强,也不能适用所有业务场景;同时,模型也并不是生成式AI创新的全部。因此,亚马逊云科技在生成式AI领域为客户提供了三层架构。

底层基础设施层,提供基础算力与基础架构。

算力方面,主要是芯片,现阶段还加入了英伟达最新推出的G200。亚马逊云科技还投入大量的力量自研芯片,包括Amazon Trainium用于训练的芯片,目前已经是第二代,推理芯片Amazon Inferentia也已经进入第二代。还包括用于训练和推理的平台Amazon Sagemaker。

用于大规模并行训练一整套基础架构也有非常重要,集中体现为UltralClusters,可以支持最多10万多个最新的Trainium2在一起进行并行训练。

中间模型层,亚马逊云科技提供基于生成式AI的一系列全新产品,其中就包括Amazon Bedrock。

应用层,提供生成式AI驱动的应用程序。目前最主要的就是Amazon Q,与自身的多个产品,比如BI产品Amazon QuickSight、智能客服产品Amazon Connect、面向编程开发人员的平台Amazon CodeWhisperer等,都实现了非常有效的结合。

通过这三层,不同的客户可以根据需求选择不同层级的产品来支持他们的业务,这比模型选择,还要再进一步。

打通生成式AI“最后三公里”

可以说,在技术服务方面,亚马逊云科技的准备还是比价充分的。但在同时,客户也面临着场景应用落地的压力,这种压力,很大程度上会给到亚马逊云科技。

就此,亚马逊云科技,除了用技术将客户的生成式AI构建项目“扶上马”,还要在后续的应用阶段再“送一程”。

亚马逊云科技通过包括架构师、产品专家、人工智能实验室、数据实验室、快速原型团队、专业服务团队等的丰富的专业技术支持资源,帮客户打通应用生成式AI的最后三公里的工程化挑战。

包括:解决方案架构师和客户一起寻找场景与解决方案,产品技术专家根据客户需求来提供产品构建的专业方案,人工智能实验帮客户打磨算法,数据实验室帮忙客户打造端到端的数据创新尝试,快速原型团队助力客户构建 MVP,专业服务团队提供专业的咨询到实施的全流程服务,以及培训与认证部门提供专业的机器学习培训等等。

正如去年6月的“2023亚马逊云科技中国峰会”上,亚马逊云科技全球产品副总裁Matt Wood,在他的主题发言中谈到的:

“亚马逊云科技始终希望将拥有广阔前景的且令人兴奋的技术提供给每个人。在云计算时代我们提供通过API访问云上应用的快捷访问,这一愿景不会因为生成式AI的出现而改变。我们想用生成式AI做同样(指亚马逊云科技的愿景)的事情,我们想把这个非常广阔的、创造性的、重要的技术放到每一个构建者和每一个商业用户的手中。”(转载注明“来源:丁科技网”)

相关内容

热门资讯

从独居到“帝国”,复杂蚂蚁社会... 协同合作让人类社会组织形式日趋复杂,人类文明也随之发展。相比我们不足十万年的文明,蚂蚁社会早在1亿多...
新款舱外航天服+太空健身装置,... 今天(12日)早上,在海南文昌航天发射场,天舟九号货运飞船和长征七号遥十运载火箭组合体开始进行垂直转...
当数据有了“智慧港口”,这些行... 文/黄海峰的通信生活 当智能化浪潮逐渐涌入产业核心生产环节,你是否想过那些驱动智能决策的海量数据,仅...
“如需空调扫码3元”,网约车开... 乘坐网约车要求开空调需额外付费? 近日,江西南昌一网友在社交平台发布信息称,自己乘坐网约车时被司机...
2025广州荔湾“羊城之夏”来... 7月11日,一场以“阅读”为核心、“科技”为翼、“运动”为脉的夏日文化盛会——2025年广州市荔湾区...
安徽合肥:多领域专家共话商业航... 7月9日,2025年空天信息大会暨中科星图生态发展大会期间,由中科星图股份有限公司主办、中科星图测控...
吉林化纤集团35K大丝束碳纤维... 近日,由吉林化纤集团联合东华大学、中材科技、时代新材、上海电气、北京玻钢院等9家科研院所及行业龙头企...
整治APP乱象重在立规明矩 点开一个新APP,不给权限就只能“劝退”;明明没点续费,银行卡却莫名被扣钱;想找人工客服,得和AI不...
科德数控取得对拖试验台专利,提... 金融界2025年7月11日消息,国家知识产权局信息显示,科德数控股份有限公司取得一项名为“一种对拖试...
消息称苹果将深耕灵动岛设计,将... IT之家 7 月 12 日消息,消息源 Majin Bu 于 7 月 10 日透露,苹果公司计划在 ...
广东永润取得一种螺旋取料机及卸... 金融界2025年7月11日消息,国家知识产权局信息显示,广东永润港口智能装备工程有限公司取得一项名为...
泰尔股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示泰尔股份(002347)新获得一项实用新型专利授权,专利名为“...
Manus多平台账号清空,官网... 7月11日,记者注意到,通用AI智能体公司“Manus”的官方微博和小红书账号的内容均已清空。与此同...
机器人产业如何强优势?广东人大... 南方财经记者郑康喜 广州报道 “调研中,各方面认为需要全社会协同发力,注重强化政府职能和发挥人大作...
深圳持续开展全社会全行业全领域... 深圳致力于打造人工智能先锋城市,按照“行业部门懂AI、公职人员知AI、市民群众用AI”思路,在前期开...
萝卜快跑一年,是“熟了”还是“... 去年夏天,无人驾驶网约车席卷武汉街头,一辆辆头顶传感器的自动驾驶车辆穿梭于三镇,没有司机也能安全地将...
2000-2024年上市公司年... 基于《管理世界》姚加权(2024)研究方法的上市公司人工智能水平测算,整理上市公司年报文本语料,对文...
2025多模态大模型发展蓝图:... 近期,一份深度探讨了2025年多模态大模型及应用发展趋势与商业化进程的报告引起了业界的广泛关注。这份...
座无虚席!IND 2025核素... 来源:市场资讯 (转自:求实药社) IND 2025 2025年7月10-11日·中国南京 由求实...
和辉光电获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示和辉光电(688538)新获得一项实用新型专利授权,专利名为“...