Agent

计算机行业周报:谷歌Agent与多模态能力重磅升级,国内外模型持续进化

计算机行业周报:谷歌Agent与多模态能力重磅升级,国内外模型持续进化

Gemini 3.5 flash 和 Omni 发布,谷歌 Agent 与多模态能力重磅升级。截至 2026/5/19,谷歌已经有 13 款产品的用户数均超过 10 亿,其中 5 款产品的用户数已突破30亿,而Gemini 是其重要的驱动因素。1)2025/5/19,谷歌发布了 Gemini 3.5 flash,这一最新模型系列将前沿智能与行动能力融为一体,标志着谷歌在 Agent 方面迈出了重大一步。3.5 flash 模型不仅具备面向智能体和编程的前沿能力,还保持了 Flash 系列一贯的高速性能,可以规模化处理智能体任务。依托 Gemini 3.5 flash 模型能力,谷歌发布可全天候运行的个人 Agent 智能体 Spark,它深度集成谷歌生态,即使用户关闭终端也可以在云端持续工作。2)Gemini Omni 发布,它是一款能够从任何模态输入生成任何内容的模型。用户可以整合图像、音频、视频和文本作为输入,生成基于 Gemini 真实世界知识的高质量视频。Gemini Omni 具备对物理世界的较深认知,能够更好地实现创意与现实的落地结合。
AI产业深度报告:AI Agent的技术演进与产业洞察

AI产业深度报告:AI Agent的技术演进与产业洞察

AI Agent 未来的演进核心在于以大语言模型(LLM)为“大脑”的范式革命,其商业价值则率先通过能够解决具体行业痛点、实现高精度和高可靠性的垂直应用和 AI Agent 开发平台得以体现。AI Agent 正从根本上重塑软件开发与人机交互的范式。随着大语言模型(LLM)的革命性突破,AI Agent 的发展已从传统架构演进为以 LLM 为核心的现代范式,具备了自主规划、环境感知与工具调用能力。这一转变开启了由多个专业 Agent 协同解决宏大问题的多智能体协作时代,驱动了从上游基础模型到下游应用的完整产业链的形成。
从数据看Agent落地节奏及商业化变现路径:生态、场景、模型能力决定Agent落地节奏

从数据看Agent落地节奏及商业化变现路径:生态、场景、模型能力决定Agent落地节奏

MCP、A2A、Responses API等协议推出3月后,Agent落地节奏如何?在AI Agent从“会说话”向“能干活”转变的过程中,AI Agent“通用语言”至关重要,亦会有生态之争,“协议破壁”与“效能刚需”共振。Anthropic的MCP、Google的A2A、OpenAI Responses API相继推出,背后均是对AI模型大规模商业化落地时点的判断。AI Agent生态加速完善,商业化顺利。
加载更多