2025年1月20日,DeepSeek发布新一代推理大模型DeepSeek-R1,以极致的“性价比”在全球AI竞技场投下“技术普惠”的深水炸弹。
这不仅是算法对算力的逆袭,更是开源生态对闭源生态的降维打击……随后全球47万个衍生模型在20天内破土而出,昇腾、腾讯云等200多家生态伙伴构建起自主可控的AI产业链,甚至倒逼OpenAI宣布GPT-5免费开放。
如今,DeepSeek的神话还在续写……深度适配、开源、差异化竞争成为当下热点。
成本重构改写行业规则
“高性能+低成本”组合,直接推动全球AI服务价格体系重构,迫使头部厂商加速技术迭代。
从阳春白雪到下里巴人,DeepSeek让AI真正飞入寻常百姓家。无论是专业人士的复杂工作场景,还是普通用户日常娱乐、学习,都能轻松驾驭,极大降低了大众运用AI技术的门槛。
性能是衡量一个模型优劣的关键指标。在性能层面,DeepSeek其独创的专家混合架构(MoE)通过任务分解与多专家协同,显著提升数学推理效率,数学推理能力超过OpenAIo1;基于2000亿Token训练量的代码生成模型,在数学推理和代码任务上已超越GPT-3.5。
成本控制则成为DeepSeek颠覆行业的关键。DeepSeekR1以557.6万美元的训练成本(仅为Gpt-4的1/10)和API调用价格(OpenAI的1/30),彻底打破“算力军备竞赛”的行业困局。这种“高性能+低成本”组合,直接推动全球AI服务价格体系重构,迫使头部厂商加速技术迭代。
正因如此,DeepSeek吸引了国内众多企业的目光。国家超算互联网平台相关负责人向中国工业报表示,根据杰文斯悖论(杰文斯悖论:技术进步提高了资源使用效率,但最终会导致该资源的总消耗量不降反增),像DeepSeek这样由技术创新提升效率的工具,其广泛应用将大规模带动算力需求的增加。
因此,社会迫切需要打造能够应对高峰值的大规模算力中心,也需要类似超算互联网的全国一体化算力网络,将全国各地的算力中心连接起来,形成面向全国算力资源池,实现全国算力资源的统一管理。此外,还要建立“算力+应用”的一体化交付体系,促进供需双方的高效对接。
中国工业报了解到,作为国家级综合算力服务平台,目前超算互联网已连接国内14个省区市的20多家超算和智算中心。目前,平台上已有各类算力商品超6500款,其中AI模型服务近240款,既有DeepSeek、Qwen等国内开源模型,也有Llama、StableDiffusion、Gemma等国外AI开源模型。
国家超算互联网平台相关负责人向中国工业报表示,当前各类用户使用AI模型热情高涨,DeepSeekChatbot可视化界面仅上线首日,访问量就突破了百万量级,用户纷纷表达出对DeepSeek最新版本与多模态(支持多种信息输入方式,如文本、图像、语音等)的期待。资深开发者和企业用户,对AIWeb应用、私有化API调用提出更多需求。接下来,超算互联网平台将积极响应用户需求,上线更多版本和功能。
开源生态引爆产业协同
DeepSeek打破了算力桎梏,为国产化算力带来新机遇。
DeepSeek的开源策略被视为国产AI生态的“催化剂”,它基于MIT许可证(一种非常宽松的开源软件许可证),将算法、模型及训练细节向全球开发者开放。DeepSeek的开源策略带来的“飞轮效应”显著:上线20天日活突破2000万,全球开发者创建47万个衍生模型(即通过对基础数据进行处理、清洗、转换和聚合等操作后得到的数据模型),形成最活跃的开发生态。
开源不仅降低技术门槛,更激活产业链协同效应。DeepSeek性能强大的另一方面,也对芯片性能提出了多元且高要求的挑战。如今,昇腾、沐曦等18家厂商已完成适配。
据中国工业报了解,芯片企业江原科技已可单卡支持DeepSeek-R11.5B/7B/8B/14B/32B/70B全部6个蒸馏模型(一种将复杂大型模型的知识迁移到更小、更简单模型的技术)。
“我们在适配DeepSeek-R1这些蒸馏模型的时候并没有碰到什么技术难题,基本上达到了开箱即用的适配速度。”江原科技副总裁杨丽慧向中国工业报表示,开源框架使产业链各环节能“专注所长”,这次适配和优化能够达到很高的效率,很大程度上要归功于开源。DeepSeek是开源大模型的代表,首次实现了开源模型性能追平闭源模型的性能,这对整个产业链,特别是国产化产业链来说都是非常正向的激励。
昇腾相关专家向中国工业报表示:“大模型将从技术摸高走向‘技术摸高+工程创新’并行,训练需求持续增长。头部玩家将战略坚定投入预训练基础模型创新,丰富模型组合,加速探索AGI(通用人工智能)。”
据中国工业报了解,昇腾拥有强大的AI计算能力和先进的集群技术,上述专家表示,双方合作能让DeepSeek充分利用昇腾的算力优势,进一步优化模型训练和推理过程,从而提升大模型的性能、效率和准确性。比如在处理复杂的自然语言理解、图像识别等任务时表现得更加出色,推动国产大模型技术达到新高度。
中国电信研究院战略发展研究所副主任分析师魏玥向中国工业报分析说道,之前由于AI大模型对算力要求较高,国产化芯片在性能和成本方面基本没有优势,AI大模型主要依赖进口高端芯片,国产化算力的目标客户和市场空间有限,对智算基础设施的建设和运营等造成影响。DeepSeek打破了算力桎梏,为国产化算力带来新机遇。
场景落地多点开花
随着大模型向着多模态融合深入、推理需求逐渐爆发的趋势发展,会诞生更多、更专业、更精准的大模型。大模型一定会向垂直领域深度渗透,与实体经济加速融合。
DeepSeek的高效推理与多模态扩展能力,使其在云、边、端及多行业场景中快速渗透。据中国工业报了解,目前各大云服务商如阿里云、腾讯云等十大平台已全面支持DeepSeek模型;垂类应用中,吉利汽车融合DeepSeekR1优化智能座舱交互,浪潮海岳大模型则借其复杂推理能力切入高门槛场景。
近日,宁夏交建交通科技研究院联合北京中关村科金研发的“灵筑”行业大模型应用平台正式接入DeepSeek模型,通过更专业的行业知识问答、技术文档撰写、投标文件辅助生成、Excel表格自动生成等众多场景,借助大模型技术变革行业工作方式。
“定位于企业服务垂域大模型的海岳大模型差异化优势显著,在接入DeepSeek之后更是解锁了企业智能化新高度。”浪潮通用软件有限公司海岳大模型研发负责人、首席技术架构师周祥国和中国工业报谈到,海岳大模型接入DeepSeek后,一方面,海岳大模型应用场景可以进一步向专业垂直领域纵深渗透,利用DeepSeek-671B的复杂推理能力,分析预测、科学计算、长文本生成等能力,可以使处理专业型、知识密集型任务的能力大幅提升,更好地切入高门槛场景应用;另一方面,它也为海岳大模型横向扩展应用领域、应用行业,提供了一种相对低成本高效率的垂域大模型训练范式。
最为关键的是,基于DeepSeek的长思维链和多层逻辑拆分能力,海岳大模型智能应用的准确性得到显著提升。如,在通用问答场景中,海岳智能问答助手基于DeepSeek,能够精准定位并回答复杂问题,有效解决大模型的“幻觉”问题。
根据第三方国际咨询机构Gartner预测,DeepSeek将推动AI服务成本年均下降90%,到2027年70%企业将采用“大模型+微调”混合架构。青云科技市场总监王玉圆向中国工业报介绍说,DeepSeek带来的不仅是推理成本的降低,更多的是给大模型公司一种新的思路。随着大模型向着多模态融合深入、推理需求逐渐爆发的趋势发展,会诞生更多、更专业、更精准的大模型,大模型一定会向垂直领域深度渗透,与实体经济加速融合。
早在2023年青云就推出了AI算力云服务,王玉圆表示:“目前使用中的客户都肯定了青云提供的DeepSeek服务。其中不少客户还要对外提供企业级服务。”
为加速人工智能大模型技术在企业级场景中的规模化落地,2月14日宁畅信息产业(北京)有限公司(以下简称“宁畅”)正式发布DeepSeek大模型一体机解决方案,搭载业界领先的DeepSeekR1/V3满血版模型和蒸馏版模型,通过软硬件深度协同优化,为企业提供从部署到场景定制的全栈交付能力,帮助制造、金融、医疗、科研等行业突破AI应用瓶颈。
普惠化、差异化成落地关键
未来,如何在普惠性与专业性、开源共享与商业回报间找到平衡点,将决定这场AI产业变革的最终深度。
DeepSeek的成功源于技术突破与成本控制的平衡、开源生态的快速扩张,以及对市场需求的前瞻性把握。
国家超算互联网平台相关负责人表示,其带动了包括强化学习、蒸馏技术(大模型知识转移给小模型模式)等发展,它不仅挑战了传统AI研发路径,更推动了AI技术的普惠化进程,AI行业应用企业将迎来全面爆发,中国的大市场将孕育出一批类似互联网时代的超级平台型和应用型企业。
众所周知,AI与互联网不同,它具有去中心化和广泛渗透的特点。AI的行业和个人应用将更加多样化。对算力需求增加,二次开发和创新的需要,也会同时增加。
尽管DeepSeek推动国产AI跨越式发展,挑战亦随之显现。近年来,国内三大电信运营商面临同质化压力。中国电信率先于2月1日成为国内首家实现DeepSeek模型落地的运营商级云平台。
魏玥向中国工业报分析,智算云服务是以大模型为牵引的,而DeepSeek将各厂商能提供的大模型的能力统一到了一个水平,如何形成差异化优势就成为主要挑战和竞争关键。
在魏玥看来,云服务的商业模式简单来说是以服务的形式向客户提供IT硬件和软件,AI大模型则是云服务商可以提供的软件之一。在众多IT硬件和软件中,云服务商选择哪些作为重点展开资源布局、技术创新、产品研发和市场营销等,很大程度上由客户需求驱动。“中国电信在DeepSeek推出后,紧锣密鼓地推进模型接入和全场景上架,也是因为捕捉到了政企和公众客户对DeepSeek高涨的兴趣和需求。”魏玥说道。
对于行业中质疑“接入DeepSeek是对企业自研大模型否认”的声音,魏玥给出解释:“中国电信自研的星辰大模型,将走出与DeepSeek互补的发展路径,将更多资源投入中国电信更有优势和积累的领域,比如目前已支持数十种方言的语音大模型,需要深度理解行业知识和客户需求的各个行业大模型,以及利用DeepSeek蒸馏形成高性能轻量级模型并与终端结合等。”
在魏玥看来,DeepSeek迅速出圈再一次证实,普惠对于科学技术的规模应用至关重要。云服务依托资源共享和规模效应等,可以促进IT普惠化,是实现AI大模型普惠的关键途径。
未来,如何在普惠性与专业性、开源共享与商业回报间找到平衡点,将决定这场AI产业变革的最终深度。正如周祥国所言,在数字经济中,无论是数字产业化还是产业数字化,技术都只是手段,真正发挥价值的还在于应用。(中国工业报 耿鹏飞)