CNN刊登的这篇文章,让我们更好的认识DeekSeek对行业的影响
AI专家解读DeepSeek火爆背后的真正原因
作者:Lisa Eadicicco,CNN
5 分钟阅读
发表 美国东部标准时间 2025 年 2 月 14 日星期五上午 6:30
DeepSeek 上个月颠覆了科技界——人工智能专家表示,这是有充分理由的,他们表示,我们可能只是看到这家中国科技初创公司在 AI 领域影响力的开始。
DeepSeek 在 1 月下旬凭借其 R1 AI 模型登上了头条新闻,该公司表示,该模型的性能可以与 Open AI 的 o1 模型大致相媲美,而成本只是其中的一小部分。随着 DeepSeek 短暂取代 ChatGPT 成为 Apple App Store 的顶级应用,科技股暴跌。
这一成就促使美国科技巨头质疑美国在与中国的人工智能竞赛中的地位,以及这些努力背后的数十亿美元。
但这不仅仅是 DeepSeek 的效率和功能。专家表示,DeepSeek R1 通过推理和“思考”答案以提供高质量结果的方式,以及该公司决定公开其技术的关键部分,也将推动该领域向前发展。
虽然人工智能长期以来一直用于科技产品,但由于 ChatGPT 和其他生成式 AI 服务的兴起,它在过去两年中达到了一个爆发点,这些服务重塑了人们的工作、交流和查找信息的方式。它使芯片制造商英伟达(Nvidia)等公司成为华尔街的宠儿,并颠覆了硅谷巨头的轨迹。因此,任何有助于构建更强大、更高效的模型的开发都肯定会受到密切关注。
“这绝对不是炒作,”艾伦人工智能研究所(Allen Institute for Artificial Intelligence)前首席执行官奥伦·埃齐奥尼(Oren Etzioni)说。“但同时,这是一个发展非常快的世界。”
AI 的 TikTok 时刻
技术领导者对 DeepSeek 的崛起做出了迅速的反应。据 CNBC 报道,谷歌 DeepMind 首席执行官德米斯·哈萨比斯 (Demis Hassabis) 称围绕 DeepSeek 的炒作“夸大其词”,但也表示其模型“可能是我见过的最好的中国作品”。
Microsoft 首席执行官 Satya Nadella 在公司 1 月份的季度财报电话会议上表示,DeepSeek 有一些“真正的创新”,而苹果首席执行官蒂姆·库克 (Tim Cook) 在这家 iPhone 制造商的财报电话会议上表示,“推动效率的创新是一件好事。
但人们的关注并不全是积极的。半导体研究公司 SemiAnalysis 对 DeepSeek 声称的训练成本仅为 560 万美元的说法表示怀疑。OpenAI 告诉英国《金融时报》,它发现有证据表明 DeepSeek 使用这家美国公司的模型来训练自己的竞争对手。
“我们注意到并审查了 DeepSeek 可能不恰当地提炼了我们的模型的迹象,并将在我们了解更多时分享信息,”OpenAI 发言人在给 CNN 的评论中说。无法立即联系到 DeepSeek 置评。
据美联社和 ABC 新闻报道,在安全研究人员强调该应用程序与中国政府的潜在联系后,两名美国立法者已经呼吁禁止该应用在政府设备上使用。流行的社交媒体应用程序 TikTok 也引起了类似的担忧,它必须出售给美国所有者,否则将面临在美国被禁止的风险。
“DeepSeek 是(大型语言模型)的 TikTok,”Etzioni 说。
DeepSeek 对科技界的深刻印象
科技巨头已经在考虑 DeepSeek 的技术如何影响他们的产品和服务。
“DeepSeek 给我们的基本上是技术报告形式的配方,但他们没有给我们额外的缺失部分,”为开发人员提供工具的 AI 平台 Hugging Face 的高级研究科学家刘易斯·坦斯托尔 (Lewis Tunstall) 说。
Tunstall 正在领导 Hugging Face 的工作,以完全开源 DeepSeek 的 R1 模型;虽然 DeepSeek 提供了一篇研究论文和模型的参数,但它没有透露代码或训练数据。
纳德拉在 Microsoft 的财报电话会议上表示,Windows Copilot+ PC 或按照特定规格构建以支持 AI 模型的 PC 将能够在本地运行从 DeepSeek R1 提炼出来的 AI 模型。移动芯片制造商高通周二表示,从 DeepSeek R1 提炼出来的模型在一周内就可以在由其芯片驱动的智能手机和 PC 上运行。
AI 研究人员、学者和开发人员仍在探索 DeepSeek 对 AI 发展的意义。
DeepSeek 的模型并不是唯一的开源模型,也不是第一个能够在响应之前对答案进行推理的模型;OpenAI 去年的 o1 模型也可以做到这一点。
DeepSeek 之所以重要,是因为它可以推理和学习其他模型,而且 AI 社区可以看到幕后发生的事情。在 DeepSeek 应用程序中使用 R1 模型的人还可以看到它在回答问题时的 “思考” 过程。
“你可以看到机器内部的轮子在转动,”高通公司高级副总裁兼技术规划和边缘解决方案总经理 Durga Malladi 对 CNN 说。
Tunstall 认为,在不久的将来,我们可能会看到一波可以像 DeepSeek 一样推理的新模型。随着科技巨头竞相构建 AI 代理,这可能至关重要,硅谷普遍认为这是聊天机器人的下一步发展以及消费者与设备交互的方式——尽管这种转变尚未完全发生。
Grok 3 是社交媒体平台 X 上聊天机器人的下一个迭代,其所有者埃隆·马斯克 (Elon Musk) 周四在世界政府峰会期间的视频中表示,它将具有“非常强大的推理能力”。
目前,AI 社区将继续修补 DeepSeek 所提供的功能。也就是说,直到下一个突破出现。
“我当然预测,在未来 12 个月里,它将被其他东西所取代,”Etzioni 说。“但这是一个非常真实的进步。”
AI 专家认为 DeepSeek 背后的真正炒作 |CNN 商业
https://edition.cnn.com/2025/02/14/tech/deepseek-ai-openai-hype/index.html
请先 登录后发表评论 ~