当一款APP应用可以代替用户进行微信发送、外卖下单、工作总结、打车出行,AI(人工智能)时代下的AI Agent(智能体)或许开始真正影响到普通人的日常生活。
10月28日,智谱AI概念股走强。截至收盘,创业黑马、首都在线、豆神教育、传智教育、正和生态等相关概念股涨停。消息面上,北京智谱华章科技有限公司(简称智谱)技术团队日前推出一款智能体产品AutoGLM,能够模拟人类操作手机,执行各项任务。
智谱CEO张鹏表示,AutoGLM 是智谱按照AGI通用人工智能升级路线图进行的探索,可以看作是智谱在人工智能能力分级 L3 使用工具能力方面的尝试,为构建 GLM-OS 、即以大模型为中心的通用计算系统打好基础。
行业内,智谱Agent产品并非孤例。此前,字节跳动豆包发布AI 智能体耳机,接入豆包大模型后可以与豆包 APP 深度结合,通过语音交互实现信息查询、旅游出行、英语学习等功能;金蝶AI 管理助手苍穹APP面向员工提供制度问询等功能,面向HR提供智能招聘、智能调配等能力;荣耀终端有限公司CEO赵明披露荣耀AI 智能体与中国移动灵犀行业首发AI智能体互联互通。
海外市场中,上周,Anthropic推出Computer use功能,实现AI接管人类电脑;谷歌正开发同类新项目Project Jarvis,可以将Chrome网页任务自动化;微软团队在Claude后推出屏幕解析工具OmniParser,可以将截图转化为结构化数据,帮助AI精准理解用户意图;OpenAI尚未发布的AI智能体雏形据悉可以操控计算机完成在线订餐、自动查询解决编程难题等任务。
赵明表示,当前市面上的智能体主要分为两类:一类是端侧的智能体,能调用其他终端的应用,两个智能体之间可以进行协同和合作;另一类是更为复杂的智能体,可以跨应用、跨智能体来模拟人类,进行屏幕的分析学习以及主动进行相应操作。
海内外人工智能企业密集瞄准Agent方向,本质上是为了向AI提升应用效率、落地现实更进一步。智谱AI研究员对第一财经记者表示,从第四季度行业密集发布类 Agent 功能和应用来看,实现大规模落地应用不是未来时,而是进行时。
目前智谱AutoGLM处于内测阶段。第一财经记者通过体验发现,该应用当下合作APP包括微信、美团、淘宝、大众点评、小红书、高德、携程等。向Agent语音传递命令后,AutoGLM会经过用户授权,自动打开目标APP,执行相关命令。但在准确度、完成度等方面尚有瑕疵。
对于第一批合作APP的选择,智谱AI研究员对记者表示,AutoGLM 是一个系统级功能,理论上,AutoGLM 可以完成人类在电子设备上的所有需求,不受限于简单的任务场景或 API 调用。目前AutoGLM在开发、适配的过程中,优先考虑用户使用最高频的场景。至于产品不完善之处,该人士称,AutoGLM基于模型能力、内容识别能力、自动纠错能力和语音能力,还在不断提升中,存在的问题将持续优化迭代。
技术层面,智谱AI研究员表示,AutoGLM 基于智谱自研的“基础智能体解耦合中间界面”和“自进化在线课程强化学习框架”,核心技术WebRL克服了大模型智能体任务规划和动作执行存在的能力拮抗、训练任务和数据稀缺、反馈信号稀少和策略分布漂移等难题,加上自适应学习策略,能够持续迭代。未来,智谱认为大模型的工具能力应像人类一样,感知环境、规划任务、执行动作,最终完成特定任务。实现模仿人类的Plan-Do-Check-Act 循环,形成自我反馈和自我提升。
需要注意的是,虽然智能体在执行任务前需要用户的授权确认,但将智能主导权交给AI会否存在网络安全隐患?对此,智谱AI研究员对记者表示,AutoGLM本身不会主动获取用户的个人隐私信息,对于授权范围以外的任务会主动提示用户、获取用户同意,涉及交易、支付等重要操作的步骤也会向用户进一步询问是否执行。每次关闭应用在后台再次启动AutoGLM功能,都会重新向用户申请无障碍权限。用户想退出使用时也可以选择在手机设置页面进行手动关闭。
文章来源于网络。发布者:经济参考网,转转请注明出处:https://www.shuahuang.com/49795.html