多模态

计算机行业周报:谷歌Agent与多模态能力重磅升级,国内外模型持续进化

计算机行业周报:谷歌Agent与多模态能力重磅升级,国内外模型持续进化

Gemini 3.5 flash 和 Omni 发布,谷歌 Agent 与多模态能力重磅升级。截至 2026/5/19,谷歌已经有 13 款产品的用户数均超过 10 亿,其中 5 款产品的用户数已突破30亿,而Gemini 是其重要的驱动因素。1)2025/5/19,谷歌发布了 Gemini 3.5 flash,这一最新模型系列将前沿智能与行动能力融为一体,标志着谷歌在 Agent 方面迈出了重大一步。3.5 flash 模型不仅具备面向智能体和编程的前沿能力,还保持了 Flash 系列一贯的高速性能,可以规模化处理智能体任务。依托 Gemini 3.5 flash 模型能力,谷歌发布可全天候运行的个人 Agent 智能体 Spark,它深度集成谷歌生态,即使用户关闭终端也可以在云端持续工作。2)Gemini Omni 发布,它是一款能够从任何模态输入生成任何内容的模型。用户可以整合图像、音频、视频和文本作为输入,生成基于 Gemini 真实世界知识的高质量视频。Gemini Omni 具备对物理世界的较深认知,能够更好地实现创意与现实的落地结合。
2025年多模态大语言模型技术及应用标准领航研究报告

2025年多模态大语言模型技术及应用标准领航研究报告

近年来,人工智能(AI)技术的飞速发展为智能汽车领域带来了前所未有的机遇。智能座舱作为智能汽车的重要部分,得益于 AI 技术的支持,有了很大程度上的进步,也逐步向着实际应用靠齐。作为智能交通的重要组成部分,智能汽车正逐步走向商业化,并成为全球汽车产业技术创新和竞争的核心。
加载更多