硅谷来信｜Meta华人科学家：DeepSeek是开源模型的胜利，它将重构全球AI话语权

搜狐科技特约作者｜Meta 科学家许家骏博士

编辑｜杨锦

如果说近几年的 AI 发展如同电影般跌宕起伏，那么 DeepSeek 这个名字无疑是最近最惊艳的“新片”。

就在昨天，我在加州DMV（车辆管理局）排队时，前后排的大妈都在热烈讨论 DeepSeek 最新推出的开源模型 R1。要知道，本来科技话题很少在大妈的寒暄里出现，没想到瞬间 DeepSeek 占据了主角位置。

一个中国团队引发的“AI 黑天鹅”

DeepSeek 的新模型 R1 在短短两个月之内，用不到 600 万美元的预算，借助并不算顶级的 H800 芯片，就实现了可以与 OpenAI 等国际领先大模型“平起平坐”的性能。

业界普遍认为，这是连英伟达（NVIDIA）和 OpenAI 都未曾预见的“黑天鹅事件”。这种“以小博大”所释放的震撼不仅仅是技术层面，也给资本市场带来余震。

硅谷来信｜Meta华人科学家：DeepSeek是开源模型的胜利，它将重构全球AI话语权

展开全文

1 月 27 日，英伟达股票经历了自成立以来最惨烈的一次下挫，单日跌幅达到 17%，收盘价跌至 118.58 美元，蒸发约 6000 亿美元市值——创下美国上市公司单日市值损失最高纪录。

更令人惊讶的是，这股恐慌还蔓延至整个芯片产业：Broadcom 下跌 17%，ASML 下跌 6%。华尔街分析师指出，DeepSeek-R1 引发了市场对 AI 芯片需求可持续性的担忧。

曾经所有人都憧憬 GPU 需求会持续“爆炸”式增长，但如果像 DeepSeek 这样低成本、高效率的大模型越来越多，企业在 2026 年后对 GPU 的采购策略就会出现“效率优先”的转变。

从顶尖学术机构到全球应用市场双线“登顶”

DeepSeek-R1 的声名不仅在工业界和资本市场搅动风云，也在学术界迅速扩张。正如 a16z（Andreessen Horowitz）合伙人、Mistral 董事会成员 Anjney Midha 所说：“从斯坦福到麻省理工，DeepSeek-R1 几乎一夜之间就成了美国顶尖大学研究人员的首选模型。”

这意味着，在前沿学术研究场景，DeepSeek-R1 已经取得了极高的认可度。

硅谷来信｜Meta华人科学家：DeepSeek是开源模型的胜利，它将重构全球AI话语权

另一方面，在消费端的热度也不断攀升。DeepSeek 的官方 App 如火箭般超越了 ChatGPT 的官方应用，强势登顶 App Store；在谷歌上的搜索指数也全面赶超 ChatGPT。某种意义上，这预示着 DeepSeek 在通用用户市场的影响力可能会延续甚至进一步扩大。

如果还要为这种爆火寻找佐证，那么来自投资大佬 Marc Andreessen（a16z 创始人）的评价堪称“核弹级背书”——“DeepSeek R1 是 AI 的斯普特尼克时刻。这是我见过最惊艳、最令人印象深刻的突破之一——而且是开源的，是对全世界的一种深刻馈赠。”

斯普特尼克时刻（Sputnik moment）源自1957年苏联发射第一颗人造卫星”斯普特尼克1号”，象征着一个划时代的技术突破，引发了全球科技竞赛的新格局，现在常用来比喻某个领域出现的颠覆性技术进展。

“性价比之王”：开源、大模型与训练范式的变革

DeepSeek-R1 的成功并非孤立。回顾其 V2、V3 版本的迭代历史，在多项评测中，DeepSeek V3 均达到了开源领域的 SOTA（最先进）水准，甚至一度超越 Llama 3.1 405B，在一些能力上可与 GPT-4o等顶级大模型正面硬碰硬。

硅谷来信｜Meta华人科学家：DeepSeek是开源模型的胜利，它将重构全球AI话语权

而这背后的核心突破，在于两点：

1. 混合专家架构（MoE） 的深度应用；

2. 以强化学习（RL）为主导 的训练范式。

这样的技术路径不仅极大降低了对海量标注数据的依赖，同时还保证了模型的性能。结果是，DeepSeek-R1 的训练总成本控制在约 550 万美元——只有 Anthropic、OpenAI 那些“豪门”动辄 10 亿美元训练成本的一个零头，堪称“大模型性价比之王”。

也难怪业内都在惊叹 DeepSeek 对 AI 民主化的贡献。最新数据显示，R1 在 HuggingFace 上以 14.9 万次下载量夺得开源模型下载冠军，其搜索和问答功能被众多用户评价“已经超越了 OpenAI 和 Perplexity”。

而真正让广大开发者欢呼的是——R1 的成本只有竞品的 3%-5%。对于那些苦于 AI 部署成本、想要快速打造高质量 APP 的初创企业，DeepSeek 等同于递上了通往未来的钥匙。

中国机会：梁文锋的“野心”与开源哲学

微软 CEO 纳德拉在达沃斯论坛上的一句话颇有意味：“必须认真对待中国 AI 的发展。”

诚然，DeepSeek 的这次爆发再次印证——即使曾经的大模型话语权主要集中在美国，如今中国企业也可能在创新层面拔得头筹。

面对外界对 DeepSeek 的追捧与各种“封神”言论，DeepSeek CEO 梁文锋在采访中表现得相当冷静。他坦言，团队最初并没打算“刻意搅动”市场，只是按照自己对成本和定价的理解去做事，结果却意外引发了一场大模型的价格战。

对于“中国更多擅长做应用而非创新”的质疑，梁文锋认为，这与中国长期缺席底层技术创新有关。“过去三十多年 IT 浪潮里，我们基本是跟随，没有真正参与创新。” 但 DeepSeek 想扮演的角色，是一个能够“跳进创新者的游戏”的玩家。

在“开源是否会丢失护城河”的问题上，他的观点颇具前瞻性：在颠覆性技术面前，闭源并不能形成长期壁垒，真正的护城河在团队和文化的持续创新能力。“开源是我们的文化选择，为了让更多人低门槛用上大模型。”

在梁文锋看来，被别人跟随、被社区共创，反而是一种荣誉。

大模型“没有护城河”背后的中国机遇

开源社区与许多技术博主纷纷指出，DeepSeek R1 证明了大模型可能真的没有“护城河”。它用最少的资金，实现了之前需要天价 GPU 资源和大量资本才能达到的效果。

这意味着，任何企业或开发者都能更轻松地打造高质量的 AI 应用，而中国团队又擅长在应用层面进行爆发式创新。可以预见，DeepSeek 给中国企业提供了新的出海窗口：用较低成本快速构建并迭代产品，抢先占据全球市场。

一位硅谷投资人最近在社交网络上发文称：“一周前，没人看好那些只是简单封装 GPT 的应用公司。今天 DeepSeek 发布了 R1，明天可能又会出现一个新的领先模型。可要让几百万人习惯性地使用某一款产品，这才是竞争壁垒。ChatGPT 之所以起步快，不是因为模型性能碾压，而是因为它用起来够简单。”

这番话点出一个关键：模型迭代的速度越来越快，尤其在国家层面，大模型更像是举国战略的一部分。谁也保不准下一次“黑马”会不会在两周后就出现。用户习惯、使用门槛这些要素，才是把大众牢牢绑住的强大护城河。

硅谷来信｜Meta华人科学家：DeepSeek是开源模型的胜利，它将重构全球AI话语权

从在 DMV排队时的大妈们口耳相传，到资本市场的惊天动荡，再到学术界的争相追捧和应用市场的热烈欢迎，DeepSeek-R1 的横空出世无疑打破了我们对 AI 产业格局的固有想象。它背后的故事既是中国公司崛起的一个缩影，也是全球 AI 浪潮再度洗牌的写照。

面向未来，DeepSeek 带来的不仅是对技术路线的启示，也是一种全新的思考方式——在开源与合作的浪潮中，任何一家公司都不可能永远独占鳌头。当大模型成本极大降低，中国公司在应用层面多年的积累与爆发力有了更广阔的舞台。

或许，这才是 DeepSeek-R1 真正带来的深远意义：让世界看到，中国也可以引领科技创新潮流，这一机遇不仅属于中国，更属于所有愿意勇敢拥抱新技术的群体。

正如 Marc Andreessen 所言：“DeepSeek R1 是 AI 的斯普特尼克时刻。” 这个时刻既是警钟，也是礼物。

（本文仅代表作者个人观点，不代表所属机构立场。）

扫一扫打开手机网站

微信扫一扫关注我们

硅谷来信｜Meta华人科学家：DeepSeek是开源模型的胜利，它将重构全球AI话语权

作者: wczz1314

发表回复取消回复

联系我们

微信扫一扫关注我们

给这篇文章的作者打赏

作者: wczz1314

为您推荐

美媒复盘：为何中国科技一再让西方措手不及？

DeepSeek｜给少数海外华人的两句忠言

美国的前国务卿蓬佩奥在我国春节期间发表关于DeepSeek的警戒言论！

原创 “天坑”专业剧变！第五轮学科评估结果来了，化学独特优势分析

原创 DeepSeek引发美国气急败坏？特朗普前后态度大反转，上演无能狂怒戏码！

英伟达平台上线DeepSeek

发表回复 取消回复

联系我们

微信扫一扫关注我们

发表回复取消回复