当地时间3月17日-21日,英伟达GTC 2025在圣何塞举办。但是在这场盛会的演讲嘉宾名单中,很难找到High-Flyer或DeepSeek的字样。DeepSeek旗下几个社交媒体账号也静悄悄的。外媒正在炒作DeepSeek员工海外出行安全问题。 High-Flyer即幻方量化,它旗下的AI团队,也就是DeepSeek的前身,早在ChatGPT尚未发布的2022年春天,就受邀在台上宣讲自己用英伟达A100搭建的万卡集群。直至2024年春天, 。最早赏识DeepSeek的巨头,正是英伟达。 GTC2022,幻方AI的黄盼盼(时任幻方AI的CEO)与张毅超(时任幻方AI的CTO)受邀在英伟达GTC的“金融AI”论坛上,做了主题为“分时调度AI算力”的演讲,介绍如何用A100构建(当时的)超大规模智算集群,及最大程度地从中榨取算力。 GTC2023,幻方AI第二次在GTC上介绍了这个基于A100的智算基础设施及其技术进展,主题为“按需分配的AI算力”。当时演讲者为幻方AI首席架构师何莺。 GTC2024,团队成员陈德里首次以幻方AI兼DeepSeek研究员的新身份首次亮相,开始聚焦于如何训练一个价值观对齐解耦化的大模型,主题为“和而不同:大语言模型价值观对齐解耦化”。 (来源:DeepSeek官方微信公众号,GTC2024视频) 从当时三场演讲背景判断,更像办公室,演讲嘉宾 大概率没有前往现场。 以DeepSeek为代表的中国企业,在这场大模型的浪潮中,发挥了越来越重要的作用。这次,英伟达还特别安排了中国AI日(China AI Day),超过40场各行各业的中文线上会议。但是,上面没有出现DeepSeek的名字,也没有High-Flyer的。 在1000多场会议日程(Session Catalog)中,也没有搜索到它们作为演讲嘉宾所属单位出现。倒是在其他几家国外厂商的会议内容概要中,见到了好几次提及DeepSeek贡献的。看起来,DeepSeek很可能像巴黎人工智能峰会那样, 。 英伟达的GTC,是全球AI界顶级峰会。这几年来,人人都在跪求AI芯片,没有特别情况,每家企业每个大佬都乐得给黄仁勋捧个场。DeepSeek是英伟达A100芯片在亚太市场的第一批大客户之一,公司创始人梁文锋还直呼公司最大的困难就是缺卡;黄仁勋则盛赞它的创新,进一步推动了全球对自家GPU的需求。而且,DeepSeek也没有颠覆CUDA,它“魔改”PTX,只是让它变得比黄仁勋宣传的更好用。 直至2025年1月20日,特朗普总统就美国的马丁·路德·金日当天——一个纪念公正与平等的日子——DeepSeek开源了推理模型R1,先后震动了硅谷、华尔街与华盛顿。美国最领先的OpenAI与Anthropic,一致攻击DeepSeek,并且向白宫建言对中国实施更严格的芯片等技术禁运。华盛顿的正在抓紧制定AI行动计划。 Anthropic的CEO阿莫迪(Dario Amodei),既不认为DeepSeek本身是对手,还声称重点也不是特别针对他们,但继续鼓吹对华芯片出口管制。OpenAI指控DeepSeek蒸馏了自己的知识,又在AI行动计划建议中称DeepSeek 。 美国各州各机构已经独立行动。1月底,德克萨斯州州长禁止在政府设备上使用DeepSeek应用;弗吉尼亚、爱荷华和纽约等州,以及国防部、NASA等机构纷纷跟进;联邦层面也有议员推动类似措施。 《华尔街日报》透露,特朗普政府考虑过至少三个选择。最容易的就是发布行政令,禁止政府雇员下载DeepSeek应用;稍难一点的,就是将其从美国应用商店下架。这两者它们都对TikTok做过。最困难的就是限制美国本土云服务提供商向其客户提供DeepSeek模型。 政策的不确定性,会影响英伟达的决策。黄仁勋迟迟未介绍替代H20的下一代中国缩水版正是如此。关于美国即将扩大芯片禁令,限制H20向中国销售的传言不断。美国政府对DeepSeek态度,也将影响英伟达的公开活动。 不过,即使没有GTC的舞台,开源社区都相信DeepSeek会继续尽可能地开放、开源。它最近还举办了开源周,一连五天,手把手教大家,如何从计算到通信到存储,优化基础设施。 有好事者甚至传言,DeepSeek会在17日开源R2,也就是GTC开幕当天。但DeepSeek迅速否认了。 |