AI营销观察
《Pika爆火,但AI视频还没到「GPT时刻」》
AI视频背后有两条技术路线,一条基于Transformer模型,另一条基于扩散模型(Diffusion model)。尽管AI视频技术取得进展,但还未达到真正的GPT时刻,即AI视频融入视频生产工作流并满足广泛需求的阶段。目前AI视频领域的竞争尚在早期,科技大厂和创业公司都在探索商业化路径。(来源:“硅基研究室”微信公众号)
《将Transformer用于扩散模型,AI 生成视频达到照片级真实感》
研究者使用Transformer作为扩散模型的去噪骨干,成功应用于视频生成领域。斯坦福大学和谷歌的研究者提出了窗口注意力隐Transformer(W.A.L.T),整合了Transformer架构到隐视频扩散模型中。在UCF-101基准上,W.A.L.T取得了最佳的零样本FVD分数,展示了其可扩展性和效率。(来源:“机器之心”微信公众号)
《马斯克打造的“叛逆”AI被曝抄袭ChatGPT?xAI工程师回应:我们没用OpenAI代码》
Gro AI机器人:由马斯克创立的xAI公司开发,能回答“尖锐”问题,具有诙谐叛逆风格。Grok被指可能使用了OpenAI模型输出进行微调,xAI工程师否认使用OpenAI代码。Grok-1在机器学习基准测试中表现优异,超越ChatGPT-3.5和Inflection-1。未来发展:Grok预计将通过用户反馈和先进学习算法快速进化,提升处理能力。(来源:“AI前线”微信公众号)
大模型应用观察
《首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为》
Alter3机器人可以通过GPT-4执行动作,如表演、自拍和喝茶等。用户无需提前编程,只需与GPT-4交谈即可指导机器人。机器人的动作虽然有些诡异,但符合指令要求,显示出GPT-4控制的多样性。研究依赖于思维链和零样本学习,允许自然语言直接转换为机器人动作。(来源:“量子位”微信公众号)
《微软小模型击败大模型:27亿参数,手机就能跑》
微软发布了一个仅有27亿参数的小型模型Phi-2,它在多数常识推理、语言理解、数学和编码任务上超越了其他大型模型。尽管Phi-2的参数数量较少,但它在复杂的基准测试中展示了出色的性能,甚至超越了参数数量是其25倍的模型。微软通过使用高质量的「教科书质量」数据和创新技术,提高了小型模型的性能。(来源:“机器之心”微信公众号)
《当企服遇上大模型,AI如何驱动企业数字化转型?|甲子光年》
AIGC的影响: 大模型的出现为企业数字化转型带来了新动力。用友集团等企业通过整合AI技术,推动从数字化向数智化转型。ChatGPT的成功和AIGC在B端业务的应用展示了大模型在企业中的快速落地,尽管存在数据安全和知识时效性等挑战。(来源:“甲子光年”微信公众号)【完】
图片来自网络,侵删