文:王智远 | ID:Z201440
去年火山引擎大会上,豆包团队展示一项功能:
用摄像头对准一个物体提问,AI能实时作答。当时看完演示视频,我有一个念头:如果做成了,AI 真的「长」眼睛了。
但这类技术从演示到落地,需要时间。毕竟,理解真实世界的视觉信息,远比生成文字或图像复杂得多;过去大半年我一直关注进展,直到上周六,终于上线了:视频通话功能。
多数人把它当作新奇玩意儿,用来玩梗、搞笑。我认为,这是一
上一篇:蓝思科技:人形机器人+蚂蚁概念双轮驱动,开启黄金增长周期
下一篇:【广州国际灯光音响展】DAV专访东来电子:揭秘SmartCTL-MFP