大模型

SVIP免费

星环科技研究报告:从Data Infra到AIInfra,大模型部署的“卖铲人”

从 Data Infra 延伸至 AI Infra。公司以大数据技术起家,AI 数据工程基因纯粹,具有大数据基础平台、分布式数据库、数据开发与智能分析工具、数据云平台等完整产品矩阵,覆盖大数据全生命周期管理。基于数据工程基因,大模型时代浪潮下公司业务定位由数字基础设施提供商进一步延伸至 AI 基础设施企业,通过整合大数据、人工智能等技术,推出知识平台 TKH,完善了AI 从基础设施到应用的产业链条。

deepseek大模型生态报告

DeepSeek,全称“杭州深度求索人工智能基础技术研究有限公司”,简称“深度求索”,于 2023 年 7 月 17 日由幻方量化创立,位于杭州市拱墅区,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术,法定代表人、执行董事兼总经理为裴湉。

DeepSeek领衔大模型创新,数字科技政策与产业协同发展

DeepSeek 引领大模型创新浪潮。DeepSeek 的迅速推广和广泛应用将推动为行业树立了高质量数据驱动的标杆,进一步提升数据标准的精准性、多样性,加强算力和数据的协同优化,进一步加快 MoE 架构、强化学习训练方法和 FP8 等混合进度技术探索创新,有望助力国内大模型产业在稳步降低成本的同时实现模型性能跃升。我们认为,DeepSeek 在一定程度上重塑了大模型的技术发展范式,‚技术平权‛为产业升级注入了新活力,尤其是在金融、自动驾驶等领域表现尤为突出。此外,知识蒸馏已成为将大型模型的能力迁移至参数规模更小的模型的重要途径,蒸馏技术成为广泛部署 R1 能力中小型模型的有效策略,使大规模端侧部署更进一步,这为小模型赋能 AI PC、耳机、玩具和智能教育设备提供了有力支持。

大模型辅助编程手册

本文是大模型辅助编程的使用指南,详细介绍大模型在日常编程与项目开发过程中的辅助编程应用及其相应部署流程。本文从大模型嵌入开发环境的程度将不同辅助编程工具分为两类:插件类以及 IDE 类,以 Github Copilot、Cline、CodeGPT、MarsCode和Codeium,与Cursor、Windsurf和MarsCodeIDE 分别为例,介绍两类工具的部署流程及具体功能。此外,本文以 Cursor的 Composer 功能为代表,展示其在量化策略编写方面的实践案例。

投研范式的革新:当大模型遇到大资管

AI技术日新月异,逐步发力应用端,其中资产管理和财富管理将成为AI赋能的“超级场景”。尤其资产管理领域天然生成海量数据,同时去中心化的投研模式有利于AI赋能相关场景。未来AI将全面赋能大资管,不仅提升了业务效率,未来有望为客户提供了更加精准与个性化的服务体验,包括营销获客与转化、客户运营及陪伴、产品组合与推介、投研及投资、风险管理、交易以及后台系统支持等方面。

半导体行业专题报告:端侧大模型近存计算,定制化存储研究框架

大模型赋能端侧AI。在人工智能的飞速发展中,大型语言模型(LLMs)以其在自然语言处理(NLP)领域的革命性突破,引领着技术进步的新浪潮。自2017年Transformer架构的诞生以来,OpenAI的GPT系列到Meta的LLaMA系列等一系列模型崛起。这些模型传统上主要部署在云端服务器上,这种做法虽然保证了强大的计算力支持,却也带来了一系列挑战:网络延迟、数据安全、持续的联网要求等。这些问题在一定程度上限制了LLMs的广泛应用和用户的即时体验。正因如此,将LLMs部署在端侧设备上的探索应运而生,不仅能够提供更快的响应速度,还能在保护用户隐私的同时,实现个性化的用户体验。端侧AI市场的全球规模正以惊人的速度增长,预计从2022年的152亿美元增长到2032年的1436亿美元,这一近十倍的增长不仅反映了市场对边缘AI解决方案的迫切需求,也预示着在制造、汽车、消费品等多个行业中,端侧AI技术将发挥越来越重要的作用。

AI大模型在投资研究中应用及未来趋势

近期 DeepSeek 系列开源大模型凭借低成本高性能的优势,引发全球关注。随着大模型训练和推理成本的快速下降,在投研场景下运用大模型技术对关键步骤进行赋能的可行性也在不断提升。当前,如何将大模型深度融入投研工作以提高投资决策的效率和质量仍然处在探索期。本文将梳理大模型的发展路径、关键技术和面向金融领域的应用案例以供参考。

人工智能大模型概念、技术与应用实践

在数字化浪潮汹涌澎湃的当下,大模型如同一颗璀璨新星,强势崛起并迅速成为科技领域的焦点。从最初的理论探索到如今在各个行业的广泛应用,大模型正以惊人的速度重塑着我们的生活与工作模式。它不仅是人工智能技术发展的重大突破,更是推动经济增长、提升社会治理效能、促进科技创新的关键力量。本报告《大模型概念、技术与应用实践》将深入剖析大模型的核心概念、原理特点以及丰富多元的应用实践案例,旨在让大家全面了解大模型这一前沿技术,明晰其在当下及未来发展中的重要地位与深远影响 ,共同探索如何借助大模型的力量推动社会各项事业迈向新的高度。

2024年中国AI大模型产业发展与应用研究报告

AI大模型是指拥有亿级以上参数的深度学习模型,从应用场景角度可分为通用大模型和垂直大模型,其中垂直大模型又可以分为行业大模型和垂直场景大模型。通用大模型,聚焦基础层和技术攻关;垂直大模型,聚焦垂直领域解决方案,在通用大模型基础上开发行业和场景专用模型,面向政务、金融、医疗、教育、交通等垂直行业和营销、客服、运营等通用场景。

AI大模型专题报告:Transformer架构的过去、现在和未来

Transformer 架构的过去和现在:人类大脑在有限的资源条件下,通过神经元回路的自组装和微调,实现了高效的信息处理。为了优化信息处理,大脑发展了高效的信息选择和投注机制——注意力,而非依赖超大容量的处理能力。随着我们对大脑认知机制的深入了解以及计算机科学的进步,研究人员尝试通过算法量化大脑的认知功能,将人类的思维模式映射到人工智能上。Transformer 是一种基于注意力机制的神经网络架构,由 Google Brain 团队于 2017 年在论文《Attention Is All You Need》中提出。通过摒弃传统循环结构,Transformer 利用自注意力机制并行处理序列元素,显著提升了训练速度和长距离依赖建模能力。Transformer 架构的灵活性,使其成为众多非自然语言处理领域先进模型构建的基础框架,展现出广阔的应用前景,包括但不限于能够将不同模态的数据映射到统一的特征表示空间,促进跨模态应用发展。目前,人工智能大模型的进化主要依赖于人工版本的更新。而随着技术的发展,研究人员正在探索自我进化的模型,使其能够自主完善和学习由自身生成的经验,从而推动人工智能向更高级的智能发展。当前 AI 的局限性或在于其学习效率的低下,而非数据不足。真正的智能不仅是数据量的堆积,而是在于对信息的压缩和提炼,类似于通过总结第一性原理的方式获取更深层次的智能。
加载更多