硅谷不眠夜：DeepSeek为何震撼美国科技界？_沙巴体育官方网站入口

成功案例

CASE

咨询电话

400-123-4567

手机：13988999988
电话：400-123-4567
传真：+86-123-4567
邮箱：[email protected]
地址：广东省广州市天河区88号

微信扫一扫

成功案例

当前位置：

主页 > 成功案例 >

硅谷不眠夜：DeepSeek为何震撼美国科技界？

起源： DeepTech深科技 DeepSeek 给硅谷带来的震动还在连续，并不见降温的迹象。假如跟多少个月前的《黑神话·悟空》在西欧遭到的追捧比拟，DeepSeek 的呈现堪称是“石破天惊”，充斥了种种弗成能、分歧理。它报告了一个怎样在层层封锁、强敌环伺的配景下铁树生花的故事，让美国经心设置的人工智能技巧小院高墙展示出了坍塌的危险。 “咱们正生涯在一个特别的时期：一家非美国公司在真正践行着 OpenAI 最初的任务——发展真正开放的前沿研讨，为全部人赋能。这看似分歧常理，但最富戏剧性的每每最可能产生。”这是英伟达高等研讨迷信家 Jim Fan 在交际媒体上收回的感叹。就在近来，这家一年多前还名不见经传的中国 AI 公司，这个模子不只在机能上比肩乃至超出了 OpenAI 的 o1，并完整开源，且以极低的本钱实现了这一冲破。这一变乱敏捷震动了美国科技界的神经。图丨Google 消息首页推举内容（起源：Google）微软 CEO Satya Nadella 在达沃斯天下经济论坛上直言：“DeepSeek 新模子的表示令人印象深入，尤其是在模子推理效力方面。咱们必需当真看待来自中国的这些开展。”Scale AI 的 CEO Alexandr Wang 乃至将其称为一款“震动天下的模子（earth-shattering model）”。“咱们发明 DeepSeek．．．．．．的机能与美国最好的模子并驾齐驱。” 图丨 Alexandr Wang 相干采访（起源：CNBC）现实上，DeepSeek-R1 的呈现确切激发了硅谷的一场小型地动。沃顿商学院教学 Ethan Mollick 对 R1 的外部思考进程惊叹不已：“DeepSeek 的原始头脑链十分诱人。它真的读起来就像一团体在高声思考。既诱人又独特”。有名危险投资人、Mosaic 阅读器结合发现人马克·安德森也表现：“DeepSeek R1 是我见过的最令人赞叹跟印象深入的冲破之一，作为开源名目，这是给天下的一份主要礼品。”这种开源精力乃至让一位软件工程师将“OGOpenAI.com”域名重定向到了 DeepSeek，以此表示 DeepSeek 更像晚期的 OpenAI，践行着开源 AI 的理念。图丨相干推文（起源：X）最直接的打击表现在同样提倡开源的 Meta 上。据美国匿名职场社区 teamblind 爆料，DeepSeek 的一系列举措曾经让 Meta 的天生式 AI 团队堕入惊恐。一位 Meta 员工在帖子中写道：“工程师们正在猖狂地剖析 DeepSeek，试图从中复制任何可能的货色。这一点都不夸大。”更令他们担心的是，“当天生式 AI 构造中的每个‘引导’的薪资都比练习全部 DeepSeek-V3 的本钱还要高，而咱们有好多少十个如许的‘引导’时，他们要怎样面临高层？” 只管 Meta 的首席 AI 迷信家 Yann LeCun 夸大，这不该被解读为“中国在 AI 范畴超出美国”，而是“开源模子正在超出专有模子”。但是，扎克伯格随后的举动仍是裸露了 Meta 的焦急：发布减速研发 Llama 4，打算投资 650 亿美元扩建数据核心，并安排 130 万枚 GPU 以“确保 2025 年 Meta AI 成为寰球当先模子”。图丨扎克伯格在相干贴文中附上的 2 吉瓦数据核心地位图（起源：Facebook）艾伦人工智能研讨所的研讨迷信家 Nathan Lambert 称，“在这一点上，Meta 绝非个例”他以为，R1 的宣布标记着推理模子研讨的一个主要转机点。在此之前，推理模子始终是产业研讨的主要范畴，但缺少一篇首创性的论文。就像 GPT-2 对预练习的主要性，或许 InstructGPT 对后练习的影响一样，咱们始终在等候一个推理模子研讨的里程碑。Lambert 指出：“推理研讨跟停顿当初曾经锁定——估计 2025 年将有宏大的停顿，并且更多将是公然的。” 那么，是什么让 DeepSeek-R1 如斯特殊？R1-zero 采取的练习战略证实了仅经由过程强化进修（RL，Reinforcement Learning），无监视式微调（SFT，Supervised Fine-Tun-ing），年夜模子也能够有强盛的推理才能。Hyperbolic 结合开创人兼 CTO Yuchen Jin 将这一冲破与 AlphaGo 停止类比：“就像 AlphaGo 应用纯 RL 下了有数盘围棋并优化其战略以得胜一样，DeepSeek 正在应用雷同的方式来晋升其才能。2025 年可能会成为 RL 的元年。” 不外，R1-Zero 在可用性方面存在的一些小成绩标明，要练习出一个杰出的推理模子，须要的不只仅是年夜范围的 RL。在 R1-Zero 的基本上，团队针对 R1 采取了一个四阶段的练习计划：起首是对分解推理数据停止“冷启动”监视微调；其次是对推理成绩停止年夜范围强化进修练习，直到收敛；第三是对 3/4 的推理成绩跟 1/4 的个别查问停止谢绝采样，开端向通用模子过渡；最后是混杂推理成绩跟个别偏好调剂的强化进修练习。这个进程不只实现了高效的练习，还坚持了模子的可读性跟终极机能。图丨 DeepSeek 采取的 GRPO（Group Relative Policy Optimization）算法框架（起源：arXiv）更要害的是，DeepSeek 经由过程翻新性的方式，在无限的盘算资本下实现了这些冲破。正如微软 AI 前沿研讨试验室首席研讨员 Dimitris Papailiopoulos 所说，R1 最令人惊奇的是其工程简略性：“DeepSeek 寻求正确的谜底，而不是具体阐明每个逻辑步调，这明显增加了盘算时光，同时坚持了高效力。” 只管 R1 备受存眷，DeepSeek 依然绝对奥秘。创建于 2023 年 7 月的 DeepSeek 始终是一家低调的公司。公司开创人梁文锋结业于浙江年夜学信息与电子工程专业，此前创建了治理约 80 亿美元资产的对冲基金幻方量化（High-Flyer）。与 OpenAI 的 Sam Altman 相似，梁文锋的目的也是构建通用人工智能（AGI）。 DeepSeek 的胜利与其奇特的开展战略密弗成分。在美国实行芯片出口控制之前，梁文锋就收购了大批英伟达 A100 芯片。占有关媒体报道，公管库存超越 1 万块，而 AI 研讨征询公司 SemiAnalysis 开创人 Dylan Patel 预估这个数目至少是 5 万块。这种前瞻性的规划为该公司的技巧冲破奠基了基本。更主要的是，面临芯片限度，DeepSeek 将挑衅转化为翻新机会。美国东南年夜学盘算机迷信博士生、前 DeepSeek 员工 Zihan Wang 告知《麻省理工科技批评》：“全部团队热衷于将硬件挑衅转化为翻新机遇。”他弥补说，在 DeepSeek 任务时期，他可能取得充分的盘算资本并有自在停止试验，“这是年夜少数应届结业生在任何公司都不会失掉的报酬。” 这种翻新精力表现在效力的晋升上。在 2024 年 7 月接收采访时，梁文锋否认中国公司在 AI 工程技巧方面绝对落伍：“咱们必需耗费两倍的盘算力才干到达雷同的成果。再加上数据效力差距，这可能象征着须要四倍的盘算力。咱们的目的是一直缩小这些差距。”梁文锋自己也深度参加研讨进程，与团队一同停止试验。而 DeepSeek 终极找到了增加内存应用跟放慢盘算速率的方式，同时不显明就义正确性。现实上，中国公司在这方面曾经构成了某种共鸣，他们不只寻求效力，并且也在越来越多地拥抱开源准则。阿里云已宣布了超越 100 个新的开源 AI 模子，支撑 29 种言语，涵盖编程跟数学等种种利用。据中国信息通讯研讨院的白皮书表现，寰球 AI 年夜言语模子数目已达 1，328 个，此中 36% 来自中国，使中国成为仅次于美国的第二年夜 AI 技巧奉献国。 “这一代中国年青研讨者特殊认同开源文明，由于他们从中受益无穷，”塔夫茨年夜学技巧政策助理教学 Thomas Qitong Cao 说。卡内基国际跟平基金会的 AI 研讨员 Matt Sheehan 则指出：“美国的出口控制反而逼得中国公司不得不想措施进步效力，把无限的算力用到极致。斟酌到算力缺乏，咱们可能会看到更多企业开端抱团取暖和。” “在 AI 行业呈现必定的分工是很天然的事件，也更节俭资本，”Cao 弥补说，“AI 开展得太快了，中国企业必需坚持机动才干顺应。” 图丨相干推文（起源：X）跟着 DeepSeek 等中国公司在 AI 范畴的突起，寰球 AI 竞争格式正在产生奥妙变更。假如中国公司可能以更低的本钱实现等同或更好的机能，并且这些模子还多数开源，美国公司赖以保持的技巧上风跟高估值可能会遭到挑衅。这种担心曾经反应在英伟达等 AI 观点公司的股价上，有剖析师乃至指出：“现实上，中国量化基金的一群超等蠢才将招致纳斯达克崩盘，但现在还不人认识到这一点。” 不外，当初就高呼“中国 AI 曾经超出美国”或“遥遥当先”还为时过早。如清华年夜学盘算机系长聘副教学刘知远所说：“DeepSeek 的冲破确切证实了中国 AI 经由过程无限资本的极致高效应用，实现以少胜多的奇特上风，中美 AI 差距正在缩小。” 但当初还远未到“瓮中捉鳖”的时间。刘知远以为：“AGI 新技巧还在减速演进，将来开展门路还不明白。中国仍在追逐阶段，曾经不是瞠乎其后，但也只能说尚可望其项背。在他人曾经摸索出的路上追随快跑仍是绝对轻易的，接上去怎样在迷雾中开辟新路，才是更年夜的挑衅。” 从年夜疆到宇树，再到当红的 DeepSeek，越来越多的中国科技公司成为美国科技界绕不外去的热点话题，一方面表现出中国公司在供给链上风下对本钱的极致敏感，这减速了技巧平易近主化的趋向；更表现出技巧竞争的魅力，假如切换一下视角则会发明，硅谷这段时光感触到的震动则是从前两年中国偕行的常态。参考材料： 1.https：//www.technologyreview.com/2025/01/24/1110526/china-deepseek-top-ai-despite-sanctions/ 2.https：//venturebeat.com/ai/why-everyone-in-ai-is-freaking-out-about-deepseek/ 3.https：//www.interconnects.ai/p/deepseek-r1-recipe-for-o1 4.https：//techcrunch.com/2025/01/22/someone-bought-the-domain-ogopenai-and-redirected-it-to-a-chinese-ai-lab/ 5.https：//www.cnbc.com/2025/01/24/how-chinas-new-ai-model-deepseek-is-threatening-us-dominance.html 新浪财经大众号 24小时转动播报最新的财经资讯跟视频，更多粉丝福利扫描二维码存眷（sinafinance）

上一篇：华尔街进入“暗黑”时期年夜少数股票买卖产生
下一篇：没有了