AI智能体遭遇责任壁垒,Mixus推出人工监督解决方案
创始人
2025-07-01 14:20:36
0

企业在关键应用中部署AI智能体面临挑战时,一种更加务实的新模式正在兴起,该模式将人类重新置于控制地位,作为防范AI故障的战略保障。

Mixus平台就是这样一个例子,它采用"同事参与式"方法,使AI智能体在关键任务中变得可靠。

这种方法是对越来越多证据表明完全自主智能体是高风险赌博的回应。

不受控制的AI成本高昂

随着企业探索AI应用,AI幻觉问题已成为实实在在的风险。在最近的一起事件中,AI驱动的代码编辑器Cursor的支持机器人虚构了一项限制订阅的假政策,引发了公众客户取消订阅的浪潮。

同样,金融科技公司Klarna在承认用AI替代客服代理导致服务质量下降后,著名地逆转了这一决定。在一个更令人担忧的案例中,纽约市的AI商务聊天机器人建议企业家从事非法活动,凸显了无监督智能体带来的灾难性合规风险。

这些事件反映了更大的能力差距。根据2025年5月Salesforce的研究论文,当今领先的智能体在单步任务上成功率仅为58%,在多步任务上仅为35%,突显了"当前大语言模型能力与现实企业场景多元化需求之间的显著差距"。

同事参与式模式

为了弥合这一差距,新方法专注于结构化的人工监督。Mixus联合创始人Elliot Katz告诉VentureBeat:"AI智能体应该按照你的指示并代表你行动。但没有内置组织监督的完全自主智能体往往会制造更多问题而非解决问题。"

这一理念支撑着Mixus的同事参与式模式,该模式将人工验证直接嵌入自动化工作流程中。例如,大型零售商可能每周收到来自数千家门店包含关键运营数据的报告(如销售量、工时、生产率比率、总部薪酬申请)。人工分析师必须花费数小时手动审查数据并基于启发式方法做决策。使用Mixus,AI智能体自动化繁重工作,分析复杂模式并标记异常情况,如异常高的薪资申请或生产率异常值。

对于支付授权或政策违规等高风险决策——用户定义为"高风险"的工作流程——智能体会暂停并要求人工批准后才能继续。AI与人类之间的分工已集成到智能体创建过程中。

"这种方法意味着人类仅在其专业知识真正增加价值时才参与——通常是可能产生重大影响的关键5-10%的决策——而其余90-95%的常规任务自动流转,"Katz说。"你在标准操作中获得全自动化的速度,但当上下文、判断和责任最重要时,人工监督会精确介入。"

在Mixus团队向VentureBeat展示的演示中,创建智能体是一个可以用纯文本指令完成的直观过程。例如,为记者构建事实核查智能体时,联合创始人Shai Magzimof简单地用自然语言描述多步骤过程,并指示平台在特定阈值处嵌入人工验证步骤,如当声明为高风险且可能导致声誉损害或法律后果时。

该平台的核心优势之一是与Google Drive、电子邮件和Slack等工具的集成,允许企业用户将自己的数据源引入工作流程,并直接从他们选择的通信平台与智能体交互,无需切换上下文或学习新界面。

平台的集成能力进一步扩展以满足特定企业需求。Mixus支持模型上下文协议(MCP),使企业能够将智能体连接到他们的定制工具和API,避免为现有内部系统重新造轮子。结合与Jira和Salesforce等其他企业软件的集成,这允许智能体执行复杂的跨平台任务。

人工监督作为战略倍增器

随着企业从实验转向生产,企业AI领域目前正在经历现实检验。许多行业领导者的共识是,人机协作对于智能体可靠执行是实际必要的。

Mixus的协作模式改变了扩展AI的经济学。该公司预测,到2030年,智能体部署可能增长1000倍,每个人工监督员将变得更高效50倍,但对人工监督的总需求仍将增长。

相关内容

热门资讯

原创 同... 不知道大家注意到没有,安卓阵营各厂商在推出新一代旗舰机型之前,总会有一些起到预热作用的机型出现,这里...
吉通凯撒铝业取得控制臂锻造模具... 金融界2025年8月19日消息,国家知识产权局信息显示,长春市吉通凯撒铝业有限责任公司取得一项名为“...
机器人越跑越快,不只是赢了比赛... 来源:2025世界人形机器人运动会 官网 文/李博 赵斌 17日,世界人形机器人运动会落幕。在百米“...
科蓝软件推出鸿蒙智能数币机器人... 科蓝软件近日在2025世界机器人大会上展示了其推出的鸿蒙智能高柜数币机器人“小蓝”,该产品以非人形设...
索诺克取得具备稳固性能的投影机... 金融界2025年8月19日消息,国家知识产权局信息显示,索诺克(苏州)光电有限公司取得一项名为“一种...
“双万兆”为人形机器人产业筑牢... 8月17日,全球首个以人形机器人为参赛主体的综合性赛事——“2025世界人形机器人运动会”在国家速滑...
调查显示韩国过半数上班族工作中... 转自:新华社 新华财经北京8月19日电(欧飒)韩国中央银行韩国银行18日说,该机构开展的一项调查显示...
格力电器获得发明专利授权:“喷... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“喷气...
路透:英伟达正开发新款中国特供... DoNews8月19日消息,据路透社报道,知情人士称,英伟达正在为中国市场开发一款基于其最新 Bla...
两部门将共同开展食品加工领域生... 工业和信息化部、国家卫生健康委近日发布通知,共同开展食品加工领域生物制造创新技术应用方向征集工作。 ...
8个与精神分裂症相关新基因发现 英国卡迪夫大学团队开展了迄今针对精神分裂症的最大规模外显子组测序研究,鉴定出8个与精神分裂症相关的新...
陕天然气获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示陕天然气(002267)新获得一项发明专利授权,专利名为“一种...
南宁师范大学发布自然资源治理A... 中国教育报-中国教育新闻网讯(记者 周仕敏 通讯员 李峙)近日,以“智绘山水·慧治自然”为主题的AI...
澳柯玛获得实用新型专利授权:“... 证券之星消息,根据天眼查APP数据显示澳柯玛(600336)新获得一项实用新型专利授权,专利名为“一...
超过200亿元!从科技成果拍卖... 在对“mRNA药物-PCSK9 RNA碱基编辑一针降脂”项目进行路演推介后,上海交通大学医学院松江研...
张平院士:6G智能体具有一定的... 8月10日,由中国通信学会、国际电气与电子工程师学会(IEEE)和IEEE通信协会联合主办,复旦大学...
原创 中... 8月17日,随着第12届世界运动会的落幕,一场科技与体育的盛宴也宣告圆满结束。作为本届世运会的官方合...
每一台机器人背后,都有个人类操... 在机器人技术快速发展和投资热潮的背后,一个关键事实其实被忽视了,那就是:许多看似自主运行的机器人实际...
科技感+烟火气!温江这个数字化... 场景升级、商品溯源 食安检测、数据共享…… “菜篮子”如何兼具 科技颜值和烟火气质? 近日,记者探访...
前魅族高管杨颜喊话魅族科技:下... 8月19日,前魅族高管、Flyme负责人杨颜在微博上突然喊话魅族科技,称“下周一表演一个撕逼给大家看...