Agent是LLM的进阶。大语言模型适用于完成相对孤立、直接的任务,而AI Agents更适合完成连续的、复杂的场景和任务。未来有望过渡到Agent模式,由人类设定目标并提供资源,AI完成绝大部分工作。
Agent能力目前处于类似GPT3到ChatGPT阶段。以OSWorld为基准,人类专家水平benchmark为72.4%。2025年1月,Open AI Operator得分38.1%。
2025年后Agent能力上限提升明显,预计迎来爆发。目前底层agent角度,海外领先为GPT的Operator,国内字节开源UI-TARS、智谱AutoGLM等均有提升,预计2025年是agent爆发的一年。