成功案例
CASE
咨询电话
400-123-4567
手 机:13988999988
电 话:400-123-4567
传 真:+86-123-4567
邮 箱:[email protected]
地 址:广东省广州市天河区88号
电 话:400-123-4567
传 真:+86-123-4567
邮 箱:[email protected]
地 址:广东省广州市天河区88号

微信扫一扫
硅谷不眠夜:DeepSeek为何震撼美国科技界?
起源: DeepTech深科技
DeepSeek 给硅谷带来的震动还在连续,并不见降温的迹象。假如跟多少个月前的《黑神话·悟空》在西欧遭到的追捧比拟,DeepSeek 的呈现堪称是“石破天惊”,充斥了种种弗成能、分歧理。它报告了一个怎样在层层封 锁、强敌环伺的配景下铁树生花的故事,让美国经心设置的人工智能技巧小院高墙展示出了坍塌的危险。
“咱们正生涯在一个特别的时期:一家非美国公司在真正践行着 OpenAI 最初的任务——发展真正开放的前沿研讨,为全部人赋能。这看似分歧常理,但最富戏剧性的每每最可能产生。”这是英伟达高等研讨迷信家 Jim Fan 在交际媒体上收回的感叹。
就在近来,这家一年多前还名不见经传的中国 AI 公司, 这个模子不只在机能上比肩乃至超出了 OpenAI 的 o1,并完整开源,且以极低的本钱实现了这一冲破。这一变乱敏捷震动了美国科技界的神经。
图丨Google 消息首页推举内容(起源:Google)
微软 CEO Satya Nadella 在达沃斯天下经济论坛上直言:“DeepSeek 新模子的表示令人印象深入,尤其是在模子推理效力方面。咱们必需当真看待来自中国的这些开展。”Scale AI 的 CEO Alexandr Wang 乃至将其称为一款“震动天下的模子(earth-shattering model)”。“咱们发明 DeepSeek...... 的机能与美国最好的模子并驾齐驱。”
图丨 Alexandr Wang 相干采访(起源:CNBC)
现实上,DeepSeek-R1 的呈现确切激发了硅谷的一场小型地动。沃顿商学院教学 Ethan Mollick 对 R1 的外部思考进程惊叹不已:“DeepSeek 的原始头脑链十分诱人。它真的读起来就像一团体在高声思考。既诱人又独特”。有名危险投资人、Mosaic 阅读器结合发现人马克·安德森也表现:“DeepSeek R1 是我见过的最令人赞叹跟印象深入的冲破之一,作为开源名目,这是给天下的一份主要礼品。”这种开源精力乃至让一位软件工程师将“OGOpenAI.com”域名重定向到了 DeepSeek,以此表示 DeepSeek 更像晚期的 OpenAI,践行着开源 AI 的理念。
图丨相干推文(起源:X)
最直接的打击表现在同样提倡开源的 Meta 上。据美国匿名职场社区 teamblind 爆料,DeepSeek 的一系列举措曾经让 Meta 的天生式 AI 团队堕入惊恐。一位 Meta 员工在帖子中写道:“工程师们正在猖狂地剖析 DeepSeek,试图从中复制任何可能的货色。这一点都不夸大。”更令他们担心的是,“当天生式 AI 构造中的每个‘引导’的薪资都比练习全部 DeepSeek-V3 的本钱还要高,而咱们有好多少十个如许的‘引导’时,他们要怎样面临高层?”
只管 Meta 的首席 AI 迷信家 Yann LeCun 夸大,这不该被解读为“中国在 AI 范畴超出美国”,而是“开源模子正在超出专有模子”。但是,扎克伯格随后的举动仍是裸露了 Meta 的焦急:发布减速研发 Llama 4,打算投资 650 亿美元扩建数据核心,并安排 130 万枚 GPU 以“确保 2025 年 Meta AI 成为寰球当先模子”。
图丨扎克伯格在相干贴文中附上的 2 吉瓦数据核心地位图(起源:Facebook)
艾伦人工智能研讨所的研讨迷信家 Nathan Lambert 称,“在这一点上,Meta 绝非个例”他以为,R1 的宣布标记着推理模子研讨的一个主要转机点。在此之前,推理模子始终是产业研讨的主要范畴,但缺少一篇首创性的论文。就像 GPT-2 对预练习的主要性,或许 InstructGPT 对后练习的影响一样,咱们始终在等候一个推理模子研讨的里程碑。Lambert 指出:“推理研讨跟停顿当初曾经锁定——估计 2025 年将有宏大的停顿,并且更多将是公然的。”
那么,是什么让 DeepSeek-R1 如斯特殊?R1-zero 采取的练习战略证实了仅经由过程强化进修(RL,Reinforcement Learning),无监视式微调(SFT,Supervised Fine-Tun-ing),年夜模子也能够有强盛的推理才能。Hyperbolic 结合开创人兼 CTO Yuchen Jin 将这一冲破与 AlphaGo 停止类比:“就像 AlphaGo 应用纯 RL 下了有数盘围棋并优化其战略以得胜一样,DeepSeek 正在应用雷同的方式来晋升其才能。2025 年可能会成为 RL 的元年。”
不外,R1-Zero 在可用性方面存在的一些小成绩标明,要练习出一个杰出的推理模子,须要的不只仅是年夜范围的 RL。
在 R1-Zero 的基本上,团队针对 R1 采取了一个四阶段的练习计划:起首是对分解推理数据停止“冷启动”监视微调;其次是对推理成绩停止年夜范围强化进修练习,直到收敛;第三是对 3/4 的推理成绩跟 1/4 的个别查问停止谢绝采样,开端向通用模子过渡;最后是混杂推理成绩跟个别偏好调剂的强化进修练习。这个进程不只实现了高效的练习,还坚持了模子的可读性跟终极机能。
图丨 DeepSeek 采取的 GRPO(Group Relative Policy Optimization)算法框架(起源:arXiv)
更要害的是,DeepSeek 经由过程翻新性的方式,在无限的盘算资本下实现了这些冲破。正如微软 AI 前沿研讨试验室首席研讨员 Dimitris Papailiopoulos 所说,R1 最令人惊奇的是其工程简略性:“DeepSeek 寻求正确的谜底,而不是具体阐明每个逻辑步调,这明显增加了盘算时光,同时坚持了高效力。”
只管 R1 备受存眷,DeepSeek 依然绝对奥秘。创建于 2023 年 7 月的 DeepSeek 始终是一家低调的公司。公司开创人梁文锋结业于浙江年夜学信息与电子工程专业,此前创建了治理约 80 亿美元资产的对冲基金幻方量化(High-Flyer)。与 OpenAI 的 Sam Altman 相似,梁文锋的目的也是构建通用人工智能(AGI)。
DeepSeek 的胜利与其奇特的开展战略密弗成分。在美国实行芯片出口控制之前,梁文锋就收购了大批英伟达 A100 芯片。占有关媒体报道,公管库存超越 1 万块,而 AI 研讨征询公司 SemiAnalysis 开创人 Dylan Patel 预估这个数目至少是 5 万块。这种前瞻性的规划为该公司的技巧冲破奠基了基本。
更主要的是,面临芯片限度,DeepSeek 将挑衅转化为翻新机会。美国东南年夜学盘算机迷信博士生、前 DeepSeek 员工 Zihan Wang 告知《麻省理工科技批评》:“全部团队热衷于将硬件挑衅转化为翻新机遇。”他弥补说,在 DeepSeek 任务时期,他可能取得充分的盘算资本并有自在停止试验,“这是年夜少数应届结业生在任何公司都不会失掉的报酬。”
这种翻新精力表现在效力的晋升上。在 2024 年 7 月接收采访时,梁文锋否认中国公司在 AI 工程技巧方面绝对落伍:“咱们必需耗费两倍的盘算力才干到达雷同的成果。再加上数据效力差距,这可能象征着须要四倍的盘算力。咱们的目的是一直缩小这些差距。”梁文锋自己也深度参加研讨进程,与团队一同停止试验。
而 DeepSeek 终极找到了增加内存应用跟放慢盘算速率的方式,同时不显明就义正确性。
现实上,中国公司在这方面曾经构成了某种共鸣,他们不只寻求效力,并且也在越来越多地拥抱开源准则。阿里云已宣布了超越 100 个新的开源 AI 模子,支撑 29 种言语,涵盖编程跟数学等种种利用。据中国信息通讯研讨院的白皮书表现,寰球 AI 年夜言语模子数目已达 1,328 个,此中 36% 来自中国,使中国成为仅次于美国的第二年夜 AI 技巧奉献国。
“这一代中国年青研讨者特殊认同开源文明,由于他们从中受益无穷,”塔夫茨年夜学技巧政策助理教学 Thomas Qitong Cao 说。
卡内基国际跟平基金会的 AI 研讨员 Matt Sheehan 则指出:“美国的出口控制反而逼得中国公司不得不想措施进步效力,把无限的算力用到极致。斟酌到算力缺乏,咱们可能会看到更多企业开端抱团取暖和。”
“在 AI 行业呈现必定的分工是很天然的事件,也更节俭资本,”Cao 弥补说,“AI 开展得太快了,中国企业必需坚持机动才干顺应。”
图丨相干推文(起源:X)
跟着 DeepSeek 等中国公司在 AI 范畴的突起,寰球 AI 竞争格式正在产生奥妙变更。假如中国公司可能以更低的本钱实现等同或更好的机能,并且这些模子还多数开源,美国公司赖以保持的技巧上风跟高估值可能会遭到挑衅。这种担心曾经反应在英伟达等 AI 观点公司的股价上,有剖析师乃至指出:“现实上,中国量化基金的一群超等蠢才将招致纳斯达克崩盘,但现在还不人认识到这一点。”
不外,当初就高呼“中国 AI 曾经超出美国”或“遥遥当先”还为时过早。如清华年夜学盘算机系长聘副教学刘知远所说:“DeepSeek 的冲破确切证实了中国 AI 经由过程无限资本的极致高效应用,实现以少胜多的奇特上风,中美 AI 差距正在缩小。”
但当初还远未到“瓮中捉鳖”的时间。刘知远以为:“AGI 新技巧还在减速演进,将来开展门路还不明白。中国仍在追逐阶段,曾经不是瞠乎其后,但也只能说尚可望其项背。在他人曾经摸索出的路上追随快跑仍是绝对轻易的,接上去怎样在迷雾中开辟新路,才是更年夜的挑衅。”
从年夜疆到宇树,再到当红的 DeepSeek,越来越多的中国科技公司成为美国科技界绕不外去的热点话题,一方面表现出中国公司在供给链上风下对本钱的极致敏感,这减速了技巧平易近主化的趋向;更表现出技巧竞争的魅力,假如切换一下视角则会发明,硅谷这段时光感触到的震动则是从前两年中国偕行的常态。
参考材料:
1.https://www.technologyreview.com/2025/01/24/1110526/china-deepseek-top-ai-despite-sanctions/
2.https://venturebeat.com/ai/why-everyone-in-ai-is-freaking-out-about-deepseek/
3.https://www.interconnects.ai/p/deepseek-r1-recipe-for-o1
4.https://techcrunch.com/2025/01/22/someone-bought-the-domain-ogopenai-and-redirected-it-to-a-chinese-ai-lab/
5.https://www.cnbc.com/2025/01/24/how-chinas-new-ai-model-deepseek-is-threatening-us-dominance.html
新浪财经大众号
24小时转动播报最新的财经资讯跟视频,更多粉丝福利扫描二维码存眷(sinafinance)
相关产品