深探DeepSeek

2025-03-19 17:50:06 · 瞭望东方周刊 · 万宏蕾

本文刊载于《瞭望东方周刊》（2025年第6期，总第929期），原题为《深探DeepSeek》。文丨万宏蕾编

国产AI大模型DeepSeek发布新一代推理大模型DeepSeek-R1，在全球AI竞技场投下技术普惠理念的“深水炸弹”。

2025年，中国人工智能产业跑出了“加速度”。3月5日，在国新办举行的国务院政策例行吹风会上，《政府工作报告》起草组成员、国务院研究室副主任陈昌盛表示，今年政府工作报告中提出持续推进“人工智能+”行动，就是要抓住这次人工智能技术突破的机遇，使我国数字技术与制造优势、市场规模优势充分结合，推动人工智能大模型的广泛应用，努力推动人工智能真正能够赋能千行百业、走进千家万户。

随着2025年1月20日国产AI大模型DeepSeek发布新一代推理大模型DeepSeek-R1，在全球AI竞技场投下技术普惠理念的“深水炸弹”，深度适配、开源、差异化竞争成为当下热点。

“在人工智能发展的漫长进程中，ChatGPT突破了自然语言处理，Sora展示了多媒体创作潜力，DeepSeek-R1在数学、代码、自然语言推理等任务的性能上实现显著跃升，更是一场极具震撼力的变革。”复旦大学计算机科学技术学院教授、博导张奇告诉《瞭望东方周刊》，“这场变革为全球通向AI未来开辟了一条新的路径，也给AI大模型的落地普及打开了更广阔的空间。”

DeepSeek在多家医院完成本地化部署，微信测试接入DeepSeek，一些城市的政务系统已接入……DeepSeek的开源生态吸引了众多开发者、机构和企业参与，同时也激活了整个人工智能产业链，无论是云服务厂商、芯片公司，还是下游应用层，均纷纷入场进行部署和适配。

大模型的突破推动了产业的爆发式增长，国产AI技术正加速创新、落地。

比亚迪“璇玑架构”全面接入DeepSeek

DeepSeek加速技术普惠

“凭借其开放性、高效性和易用性，DeepSeek开源模型正在成为推动AI技术普惠化的重要力量。”张奇说，“DeepSeek的高效推理与扩展能力，使其在云、边、端及多行业场景中快速渗透。”

“我们的大型企业客户对智能化需求有其特殊性，要场景垂直度高、任务复杂度强、数据安全要求严。达观智能问答系统全面接入DeepSeek大模型，涵盖其各个蒸馏版本和满血版本，可以实现全版本灵活调用+知识库深度联动，相当于为企业打造了一个可配置、可思考、可行动的智能中枢。”达观数据CEO陈运文告诉《瞭望东方周刊》。

“当企业遇到问题时，通过结合DeepSeek模型与RAG（Retrieval-Augmented Generation，是一种结合了检索和生成技术的模型，主要用于自然语言处理任务中）框架，系统能够从海量数据中精准召回素材内容，再利用DeepSeek强大的深度思考和推理能力，最终呈现清晰且完整的结果。后台配置里，企业还可以自行选择调用基础模型。”陈运文说。

“比如，在客户的金融信贷材料、合同、招股书、监管报告等专业文档审核中，DeepSeek模型可助力自动提取关键条款、交叉验证数据逻辑，并基于行业风险库生成审核建议，帮助金融机构将人工复核工作量再次提速，同时规避隐性合规风险；在供应链管理场景中，达观智能体可自主拆解企业级任务，同步协调订单数据解析、供应商资质核验、物流异常预警等子任务，企业可借此实现跨系统业务流程效率提升50%。”陈运文说。

“下一步，达观数据还将打造办公智能体，这一智能体不仅能够理解用户需求并给出准确答案，更能自动执行一系列复杂任务，实现企业内部工作流的全面自动化。”陈运文说。

2025年2月12日，国网信息通信产业集团有限公司自主研发的模型服务云MSC平台全面接入DeepSeek大模型。

2月15日，中国华能集团有限公司完成了DeepSeek系列模型的本地化部署，并在集团“iHN+”移动门户中推出了“睿智小能”AI助手。“目前，在通用知识基础上，结合规章制度、故障分析等企业数据库，利用预置提示词，AI助手实现了知识问答、公文拟稿、智能校对、文件解读、科研辅助等基础功能，高效辅助日常办公与管理。”华能数字化部相关负责人说。

据不完全统计，目前多家能源企业将DeepSeek深度融入业务。比如，发电厂设备检修、虚拟电厂能源调度、合规审查等，AI技术已嵌入能源生产、管理的全链条。

DeepSeek正式登录乌鲁木齐，在皖疆绿色算力科技产业园完成部署上线。图为2025年2月13日，皖疆绿色算力科技产业园工程师在产业园2A机房巡检

“能源行业生产端是一个超级复杂的环节，它的品类有煤电、核电、水电、光伏、风电、生物质能等，分布广泛，产出复杂多变；电网端，更是现代工业体系中数据量最大、变动量最大、复杂度最高的体系之一。”中国电子商会副会长熊焰分析，“比如电力交易系统，这个场景就有数以万计的发电侧，包括稳定的煤电、水电和核电，还有不稳定的风电、光伏。在需求侧，又面临着用户多种多样的需求。从预测、调整，到交易、优化，接入大模型后，整个电力交易系统相当于拥有了一个更聪明的大脑。”

“患者走进医院，把自己不舒服的地方告知AI医疗机器人，一分钟不到，就医路径就在屏上出现：请先前往一楼A区抽血，再到B区拍摄胸部CT……检查完毕回到家，检查报告、诊断结果已传至手机，药品当晚配送到家。”上海市第六人民医院金山分院副院长殷峻如此描绘，“类似的自助式医院或许不远了。”

殷峻是一位内分泌代谢科专家，在他印象中，全球早期AI医疗应用最具里程碑式的突破，是在糖尿病视网膜病变读片领域。如今，DeepSeek结合医院内部医疗数据，有望训练出更多治疗“最优方案”，且带有各医院“标签特色”。

据统计，截至2025年3月，国内已有超百家三级医院官宣完成DeepSeek本地化部署，涉及北京、上海、广东、江苏、浙江等20余个省份。DeepSeek正全方位渗入到临床决策支持、病历生成和质控、疾病科普、健康管理、科研辅助、医院管理等各种医疗场景中。

四川省人民医院通过“DeepSeek大模型”，将人工智能（AI）技术用在看病全流程中。图为该医院医生通过诊室听译机器人对患者问诊，快速生成病例报告

前不久，浪潮海岳承建的某建筑央企智能问答项目正式上线，基于浪潮海岳大模型平台与DeepSeek大模型的深度结合，制度查询平均耗时从15分钟缩短至10秒；通过训练，海岳大模型对《工程项目管理办法》等桥梁施工领域的专业文件理解准确率达96.5%；在跨部门协同方面，系统能够自动关联制度负责人，将专家响应时间从2小时缩短至5分钟。

另外，浪潮海岳大模型突破了面向桥梁施工的多维度领域知识库构建、面向智能编制的多智能体协同等多项关键技术，构建了私有知识库，打造了该建筑央企专属的施工方案智能编制平台。“相较于传统人工方式，方案编制时间从数周缩短至45分钟，减少了50%以上的人力投入，并保证100%符合国家和行业规范，减少了90%以上的人工错误，施工风险识别率提升至90%以上。”浪潮海岳相关负责人说。

“一方面，海岳大模型应用场景可进一步向专业垂直领域纵深渗透，使处理专业型、知识密集型任务的能力大幅提升，更好地切入高门槛场景应用；另一方面，其也为海岳大模型横向扩展应用领域、应用行业，提供了一种相对低成本高效率的垂域大模型训练范式。”浪潮通用软件有限公司海岳大模型研发负责人、首席技术架构师周祥国说，“定位于企业服务垂域大模型的海岳大模型，在接入DeepSeek之后解锁了企业智能化新高度。”

瞬间构建AI智能体

“在国产大模型DeepSeek发布之前，我们在2024年12月底刚刚做完产品更新。春节后，我们率先在Agent（智能体，指能够感知环境并采取行动以实现特定目标的代理体）全线接入DeepSeek，发布Agent产品家族，包括RPA Agent（iBotX）、智见分析Agent、Hyper Agent和Agent Store-100中心四款核心产品，为企业智能化转型提供全方位的解决方案。”上海容智信息技术有限公司（以下简称“容智信息”）CEO柴亚团告诉《瞭望东方周刊》。

容智信息2016年成立于上海，经过2年多的技术研发，于2018年完成自主知识产权的国产RPA产品iBot。

“当很多公司还在摸索怎么让DeepSeek与公司业务深度适配时，我们已经能迅速拿出产品适配100多个行业场景，涵盖金融、零售、制造、运营商、物流、现代服务业等多个领域。”柴亚团说，“平台基于行业与部门的细分，用户登录后可轻松浏览精准匹配业务场景的众多Agent，点击‘聘用’，即可在线体验标准版。此外，用户还可进行个性化定制，并实时跟踪Agent的KPI表现，真正开启人机协同办公新模式。”

DeepSeek凭借国产化与自主可控、多模态与场景适应能力、高效推理与低成本部署三大优势，在确保高性能的基础上将成本压缩至行业平均水平的60%，为中国企业大规模应用AI Agent开辟了更可行的路径和广阔前景。

“目前，许多科技公司推出了面向C端（终端用户）的通用型AI Agent产品。在这些平台上，用户只需简单描述即可生成语音陪伴助手、外语练习助手、图像生成助手等，极大提升了生活便捷性。但在B端（企业端），Agent首先引领的是企业软件架构革新。”柴亚团说，“我们以RPA（机器人流程自动化）为基因，深耕B端市场，聚焦企业核心执行层。”

2024年9月，上海容智信息技术有限公司CEO柴亚团正在介绍公司AI Agent企业级解决方案

传统企业软件依赖后端系统和数据库进行管理，业务数据与交互集中于后端服务器，导致架构复杂、运行效率受限。而AI Agent通过智能化能力，将数据库交互、用户请求处理与业务流程执行深度融合。这种高度集成与智能驱动，使AI Agent取代了传统的人工编程与分散管理模式，不仅简化了企业软件架构，还从根本上增强系统的灵活性与智能决策能力，为企业带来更敏捷、高效的运营模式。

例如，财务Agent能够无缝整合多个系统，自动从财务管理平台提取多维度数据，智能分析并生成定制化的财务报告。“假如企业某位员工离职，以前要找各个部门走流程。现在只要构建AI 智能体，流程将大大简化。等新员工入职，即可轻松完成账号重建、资产恢复。通过知识库智能体，新员工还可以轻松掌握公司制度、流程信息。”柴亚团说。

另外，容智iBotX数字员工RRPA Agent，在RPA的基础上融入大模型能力，使其不仅具备人机对话、思考、推理、内容生成和总结等智能化能力，还结合了RPA丰富的动作执行能力，能够高效应对大量端到端的复杂业务场景。“这一升级不仅大幅拓展了能力边界，还显著提升了其灵活性和实用性，重新定义了人机交互，为RPA这双灵巧‘双手’装上了智慧大脑，更与大模型强强联合，为业务流程自动化带来了前所未有的可能。”柴亚团说。

“其实，我们已经研发智能体两年多了。过去很大的问题是受制于大模型能力，智能体成本高且输出不稳定，都不好意思拿出来给客户使用。”柴亚团回忆，“DeepSeek发布后，这款基于DeepSeek的智能体终于真正能在实际场景中用上了，不仅开源免费，而且速度快，输出稳定。”

“现在，容智创新融合大语言模型与智能体技术，打造了开箱即用的Hyper Agent专家级智能体开发平台。通过可视化配置界面，业务人员无需编写代码，只需进行简单修改，即可在秒级时间内完成Agent部署，实现业务流程智能自动化，真正做到‘所想即所得’。”柴亚团说。

6个月与6天

“我要发自内心地感谢DeepSeek。”宁波云锦微智能科技有限公司（以下简称“云锦微”）创始人、CEO王文艺告诉《瞭望东方周刊》，“打个比方，我之前在人工智能行业做计算机视觉时，大家觉得行业市场规模是夜空里的星星，后来GPT出现，大家认为AI市场规模有月亮那么大了，而DeepSeek，则将市场规模放大到比太阳还要大。”

云锦微成立于2021年6月，是一家专注于研发具身智能体操作系统的科技公司。“在工业生产中，不同行业场景对识别目标物需求极为多样且细碎，在计算机视觉时代存在着很多无法被覆盖和满足的算法需求，如垃圾分拣、质量检测、运维检修等等。而大模型技术的出现让这些需求有了更便捷、成本更低的解决方案。”王文艺解释，“我们的目标是让每一个设备都插上大模型的翅膀，所以低成本、高性价比是云锦微的一大特色，尤其在AI芯片的国产化适配方面。”

目前，云锦微已经帮助企业开发者客户在能源、水务、交通等多个场景实现了商业化落地。

2025年1月，科大讯飞与云锦微签订生态投资合作协议，双方将在多模态技术、全球市场拓展、投资机构对接等方面展开全面合作，共同推动具身智能体在各个行业的普遍应用。

“从商业角度来看，DeepSeek首先降低了我们的成本。现在模型计算与使用成本仍然存在，但知识使用成本已经降到零。”王文艺说，“其次，它通过开源免费将慢思考能力和深思考能力融入各行各业。”

“最重要的是带给了我们更多商业机会，可将当下的行业经济规模至少放大十倍，未来更会指数级增长。我们春节后一开工，接到的咨询量急速增加，商业面也迅速扩大，很多政府部门和事业单位都在咨询将内部流程知识库接入DeepSeek。”王文艺说。

2025年2月26日，北京市丰台区，综合窗口工作人员使用DeepSeek大模型版“丰小政”解答市民咨询

“春节期间看到DeepSeek爆发后，我的第一反应就是市场要变天了。”王文艺说，“以前我们想要成交一个客户，需要有专业的业务顾问和技术专家团队和客户沟通，了解客户的业务目标、流程、应用场景、功能期望，再给出关于智能体应用的可行性分析和战略建议。这个过程从我们初步了解客户到客户真正下单，至少要6个月。现在我们基于DeepSeek开发了一个小程序，类似于数字销售员。客户被这个专业的数字销售逐步引导，帮助测试我们的产品，判断我们的能力，6天左右就能筛选出我们与他是否匹配。接入DeepSeek后，一周时间的订单量就相当于以前一个月。”

“最近市场一哄而上都在做DeepSeek私有化部署一体机，水平参差不齐。这和上世纪90年代初专业人士组装PC机的情况类似。”王文艺说，“目前有很大一批中小微企业对DeepSeek非常好奇，但他们预算不高，自己没有专业IT开发团队，想尝试却没有人帮他DIY。这种情况下，开箱即用的DeepSeek一体机需求量非常大。”

“我们帮助客户配置DeepSeek一体机，除了根据客户对智能体的性能需求和应用场景需求，对处理器、内存、存储、显卡等关键硬件组件进行选型和优化，还会免费提供给客户多模态底座、大模型和AI开发工具。我们希望客户在未来需要多模态整合时，可以看到我们的能力。”王文艺说，“在我们尚未完成推广视频，未通过代理商渠道，没有广泛推广的情况下，目前咨询量已经非常大。”

“2025年，行业将爆发式增长，人工智能真正开始‘大航海时代’。如果说以前大家还在港口摇旗呐喊，要去发现新大陆。那么现在，无论是大轮船还是小舢板，都可以尽快出海了。”王文艺说。

通用智能尚在路上

“DeepSeek能在AI领域崭露头角，离不开其在技术层面的诸多创新，这些创新点成为它突破传统、实现飞跃的关键因素。”张奇说， DeepSeek在研发过程中深度融合了大量国内互联网信息，使其对中文语境高度敏感，能够精准把握本土用户的需求与语言习惯。在处理中文翻译任务时，它能够充分考虑到中文语言的丰富内涵和文化背景，给出更加准确、自然的翻译结果。当翻译一些具有中国特色的成语、俗语时，DeepSeek能够深入理解其背后的文化寓意，将其准确地翻译成外文，让外国用户也能领略到中国文化的博大精深。在语义理解和多轮对话场景中，DeepSeek表现得更加自然流畅，能够更好地理解用户的意图，提供更加个性、精准的服务。比如在智能客服场景中，它能够快速理解用户的问题，并给出针对性的解决方案，大大提高了用户的满意度。

“作为中国团队自主研发的成果，DeepSeek在中文理解与生成方面具有天然优势，这是它区别于其他国际AI产品的一大特色。”张奇分析，“相比之下，尽管一些国际知名的AI产品在上下文理解、创意写作等方面表现出色，但在处理中文信息时，往往会因为对中文语境的理解不够深入而稍显滞后。这就使得DeepSeek在本土市场上具有独特竞争力，能够更好地满足国内用户的需求，为推动中文自然语言处理技术的发展作出重要贡献。”

不过，我们也必须清醒地认识到，DeepSeek虽然强大，但距离通用智能的目标仍然遥远。

通用智能，代表着人工智能发展的终极理想。它是指一种具有人类级别的认知能力，能够理解、学习并应用于广泛任务领域的人工智能系统。这意味着它并非局限于特定的任务或领域，而是像人类一样，具备广泛的适应性和灵活性，能够处理各种类型的任务，无论是日常的生活琐事，还是复杂的科学研究，都能应对自如。

“包括DeepSeek在内的大语言模型的底层逻辑都依然是统计机器学习，其运作方式是传统的喂数据、训练、输出结果模式。在技术层面，DeepSeek在某些任务上表现出色，但其本质上还是一个被训练出的智能模型，不是真正意义上的智能体。”张奇分析，“DeepSeek虽然在一些复杂问题上能够展现出强大的计算和推理能力，比如在数学、代码处理等任务中表现出色，但对于那些没有在训练数据中充分体现的场景和问题，它也难以准确应对。这意味着，DeepSeek的能力边界取决于它所学习的数据和训练的场景，而不是像人类一样具备通用的智能，即可以举一反三，灵活应对各种未知情况。”

“尽管大语言模型目前距离通用智能还有一定的距离，但它在通用智能的探索道路上，带给我们诸多值得期待的可能性和方向。”张奇说。

市场机会显著

“接下来的一年有望成为AI应用爆发的黄金期。”快思慢想研究院院长、原商汤智能产业研究院创始院长田丰告诉《瞭望东方周刊》。

“对于普通人而言，更形象的比喻是2024年的大模型更像文科生，而2025年的大模型更像理科生，并且具有博士逻辑推理水平。它的思路过程中展示的逻辑能力非常接近教授水平或者说数学家水平。因此从这一点来看，在推理能力上，中国的大模型每半年甚至每个季度都在快速提升。”田丰分析说。

“这股DeepSeek热潮是一次非常成功的市场教育，它让社会大众、C端的个人和企业使用者，还有相关政策制定者都非常直观地认识到AI的核心易用性和巨大价值。让从业者和大模型厂商看到了在成本可控、算力有限的前提下也可以训练出高性能模型的可能性。”罗兰贝格全球合伙人兼大中华区副总裁李冰博士告诉《瞭望东方周刊》。

2025年2月24日，湖北省襄阳市老年大学授课教师在电脑课上为学员讲解如何使用DeepSeek人工智能应用

“从ToB（Business to Business，企业与企业之间的商务模式）的角度来看，AI在制造业等领域都会有广阔的市场机会，不过目前仍是市场初期。比如在制造业中，质检就是典型的AI机器视觉发力的领域。不过，相对而言，AI目前更大的市场其实在ToC（Business to Consumer，企业对消费者的商务模式）。”李冰解释说，“除了Agent外，智能硬件将有新的、显著的市场机会，如AI眼镜、AI耳机、AI手机、AI电脑、AI家居等等，都值得期待。”

田丰也持同样看法，“基础模型的价格战可能会告一段落。AI应用领域，我们可能在2025年看到爆款应用的涌现。除了传统软件的AI化，硬件AI应用也会非常丰富多彩。比如AI家居，它不仅可以提供传统冰箱的制冷保鲜或者空调的环境舒适，还可以关心你的健康状况。这就意味着，家电产业正在向服务业延伸——原来家电产业的服务可能包括安装维保，但现在的服务是冰箱将为你安排健康菜谱。”

“就服务业而言，现在大量服务业的任务场景都可以用‘传统互联网+传统服务业+大模型’去完成。例如，原来的定制旅游服务，现在用大模型可以做得更好，大模型可以理解客户的复杂需求，并利用海量信息，更精准地满足客户对成本和体验的需求。”田丰说。

“中短期内，我们一定会朝着‘更高性价比’或者说‘更便宜’的大模型方向发展。原因是今天我们可以使用高质量训练的大集群和大规模数据，数据红利已经到达尾期。因此单纯依靠预训练解决方案，即预训练技术路径可能会继续前进。但性能的提升将变缓。”李冰说。

“未来，全球对AI人才的抢夺可能更加激烈。人才是科技企业的第一资产。”田丰说，“以往外界普遍认为，那些成绩最拔尖且有志于在理工科领域发展的中国青少年，其标准发展路径是在中科大、清华北大等高校读完本科，然后留学美国伯克利、麻省理工、斯坦福等大学，读完硕博士，再去微软或谷歌之类跨国大企业工作几年。但现在我们看到，从浙大、清华毕业的本土博士，甚至在读的硕士研究生都创造出了非常好的成绩，这代表我们的大学尤其是AI硕博士的教育水平已经提高。这归功于国内教育体系的不断创新，还有领军科学家的栽培。”

“这批爆火的AI研发创新团队，年龄都在24岁到35岁之间。青年科学家爆发出极大的原始创新能力和潜能。”田丰建议，“下一阶段，我们要给青年科学家更大的科研自由度和资金支持，以更高的科研预算、更开放的学术态度、更好的人才保护政策去鼓励创新。”

田丰还建议，在中国寻找并建设一些长期支持人工智能核心软件基础研发、芯片基础研发的金融体系、机制，助力创新创业者在5年或者10年内取得国际上绝对领先的原创成果。

（作者系《瞭望东方周刊》“人工智能+”工作室主任）

-END-

联系入群|加微信89931668

免费DeepSeek教程与学习资料

下载网址：qitongshe.com/deepseek