
AI Agent:是「真香」预警,还是「智障」翻车?

AI Agent:从概念到现实,是助手还是幻影?
引言:Agent之火,烧向何方?
当ChatGPT还在为人们提供信息咨询时,AI Agent已经开始尝试接管我们的工作。从OpenAI的Operator到国内创业公司蝴蝶效应推出的Manus,AI Agent似乎正在成为人工智能的下一个风口。但令人兴奋的背后,我们是否应该保持一丝冷静?AI Agent真的能像比尔·盖茨所说,让我们永远摆脱搜索网站和亚马逊吗?
1、AI Agent:一场“类人”的进化?
1.1 Manus横空出世:更进一步的自主性?
Manus,这款号称“全球首款通用型AI Agent产品”,的确让人眼前一亮。它能够独立思考、规划并执行复杂任务,直接交付完整成果。例如,在筛选简历时,Manus可以自动解压文件、上传简历、浏览简历,并记录重要信息,给出自动排名建议,还能根据工作经验等重要维度,将候选人分为不同等级。
与传统大模型相比,Manus似乎展现出了更进一步的自我思考和自我规划能力。它不只是提供想法,还能帮用户把想法变为现实,解决实际问题。这种全链路自主执行能力,是通过“规划-执行-验证”的多代理协同架构实现的,用户无需过多干预,只需等待结果。
1.2 OpenAI和Anthropic的入局:巨头的布局
实际上,OpenAI和Anthropic也在积极布局AI Agent。OpenAI推出了Operator和Deep Research,前者定位为AI助手,后者则像一个“AI研究员”,能够大幅缩短研究时间。Anthropic则推出了Computer Use,让用户能够像指挥人类一样指导Claude操作电脑。
1.3 Devin的出现:AI软件工程师的雏形
此外,Cognition AI推出的Devin更令人印象深刻。Devin是一个自主Agent,能自主学习不熟悉的技术,端到端地构建和部署应用程序,自己改bug,甚至还能训练和微调自己的AI模型。
1.4 AI Agent的核心:效率与准确度
AI Agent的工作原理可以概括为四个步骤:感知、信息处理、执行、输出。要真正成为人类的AI助手,效率和准确度至关重要。Manus之所以能脱颖而出,很大程度上是因为其在GAIA基准测试中取得的突破性成绩,解决复杂问题的准确率高于Open AI同类产品。
AI Agent的出现,让AI完成了从被动响应到主动执行的跃迁。当AI开始突破认知层,转向行动层,AI时代或许才真正到来。
2、AI Agent:巨头与独角兽的竞逐
2.1 行业共识:2025年爆发元年?
百度创始人李彦宏认为,2025年可能会成为AI智能体爆发的元年。市场研究机构Gartner也将Agentic AI列为2025年十大技术趋势之一。德勤AI研究院也认为,AI智能体将改变基础业务模式,实现新的工作、运营和价值交付方式。
2.2 大厂的策略:赋能业务,完善生态
各大科技公司纷纷入局AI Agent领域。百度将智能体应用到移动生态的各个场景,包括百度新搜索、百度文库、百度电商、文小言等产品。阿里则将AI智能体重点放在了To C领域,将其融入到通义APP中。腾讯也计划在微信、QQ、输入法、浏览器等产品中推出AI智能体。字节跳动则推出了与OpenAI Operator功能相似的UI-TARS。
大厂们凭借算力、数据等优势,基本都是在模型端、应用端、智能体开发平台协同三个领域闭环发展。字节跳动的扣子、腾讯云的腾讯元器、百度智能云千帆AgentBuilder、阿里云大模型平台百炼等一站式智能体开发平台均已上线。
2.3 独角兽的策略:场景落地,商业变现
在AI独角兽中,智谱是最早探索Agent的初创企业,推出了自主智能体AutoGLM。阶跃星辰则宣布发力智能终端Agent方向,与吉利汽车集团、OPPO、智元机器人等企业深化合作关系。月之暗面的Kimi上线了Kimi+智能体商店,旗下有20多个由官方提供的智能体。
AI初创企业布局智能体的思路在于,通过自身模型能力与智能体的结合,推出更多可场景化的落地方案,寻找商业变现的路径。
3、AI Agent:理想很丰满,现实很骨感?
3.1 Manus的困境:是通用,还是“套壳”?
Manus的爆火也引发了一些质疑,例如通用型的“套壳”嫌疑、官网卡顿等问题。Manus团队也承认,当前的Manus距离正式版还有很远的路要走。
Manus的困境,实际上是当下AI Agent赛道的缩影。
3.2 AI幻觉:无法避免的难题?
AI Agent面临的首要问题就是AI幻觉。OpenAI的Operator可能因数据污染生成错误结论;Manus在实际应用中也常因系统权限限制无法完成订餐、支付等任务。
DeepSeek-R1幻觉率高达14.3%,GPT-4.5幻觉率为7.1%。某种程度上,AI幻觉能力与其推理能力正相关。也就是说,越聪明的AI大概率幻觉越强。
幻觉问题无疑是AI Agent爆发的主要障碍,尤其是在金融、医疗、法律等高风险领域,任何误差都可能引发严重后果。
3.3 数据缺乏:进化的瓶颈?
幻觉问题的根源在于数据的缺乏。AI需要源源不断的数据反馈来进化,而数据的训练离不开实际的应用落地。
目前,C端智能体大多定位智能助手,可通过读取语音指令理解用户意图,并模拟人类行为,完成订机票、点外卖、筛简历等基础日常需求和工作。但用户留存和心智培养仍然是个问题。像Manus这类主打通用的Agent,或许很难在垂直场景下发挥作用。
3.4 B端落地:定制化与安全性
B端智能体则需要提供更为专业和定制化的服务。在B端场景下,Agent可充当数字员工、个人助理、营销客服等工种,真正为企业创造价值。一些声音认为,B端Agent市场有望率先起量。
但企业对数据安全和隐私保护非常重视,AI Agent在处理企业数据时,必须确保数据的安全性和保密性,防止数据泄露和滥用。
落地当然不容易,这需要不断扩展的算力、数据、场景做支撑。但市场的热情已经被点燃,玩家都在为“让AI帮人做事”而努力。
当大模型与Agent深度融合,一个更智能、更主动、更个性化的AI时代正加速到来。这一次,独角兽和大厂们都在加速奔跑,没有一个甘心落后于时代。
(完)
还没有评论,来说两句吧...