美国方面连续三年发出学术交流邀请,对象是同一个中国人,而他每次的回答只有两个字:不去。
谁?DeepSeek创始人梁文锋。
美国人想要的不是他这个人,而是他脑子里的那套东西——一套用560万美元,打穿了好几个亿美元级别AI项目的技术路线。
他到底凭什么敢说不?故事,得从一个广东农村的小孩说起。
1985年,梁文锋出生在广东湛江吴川的一个普通家庭。父母都是小学教师,家里没有任何科技背景,住的是粤西那片和繁华完全不搭边的地方。
但这个孩子,从小就有点不对劲。
初中的时候,同学们还在对付二次方程,他已经把微积分翻完了,自学的。他不是"别人家的孩子",他是那种让"别人家的孩子"也崩溃的存在。2002年,17岁的梁文锋以吴川一中高考状元的身份考入浙江大学,攻读电子信息工程,后来硕士方向是机器视觉。
毕业那年,有消息说大疆创始人汪滔曾邀请他一起创业,被他婉拒了。他心里装着另一件事:人工智能,会改变世界,这件事他很早就信了。2008年,全球金融危机爆发。 别人在愁钱,他在研究一个问题:机器能不能自己炒股?他组了一个团队,开始用机器学习探索全自动量化交易。整整7年的低调磨剑,2015年,他正式创立幻方量化,6年之后,管理规模突破千亿人民币。
这是前菜。真正的主菜,还在后面。
2023年,梁文锋做了一个让很多人觉得他疯了的决定——放着千亿量化不好好守,要去搞通用人工智能,要做大模型。
当时的背景是什么?OpenAI刚刚把ChatGPT扔出来,全球科技圈被炸懵了,国内一堆公司排队跟风,抢着宣布"我也要做大模型"。
但大多数人跟的是风口,梁文锋盯的是更深的东西。
他在一次采访里说了一句话,我觉得能概括他整个逻辑:"大部分中国公司习惯follow,而不是创新,中国AI和美国真正的差距,是原创和模仿的差距。"
说完,他就去干了。
2023年7月,DeepSeek正式成立。 团队规模?不到140人。全是中国年轻工程师,大部分工作年限3到5年,超过8年经验的反而不招——他们觉得老手包袱太重,创新力不够。好几位核心成员是当年的应届博士。
就这么一支年轻队伍,他们开始做一件"正常逻辑下不该能做到"的事。
2024年12月,DeepSeek-V3上线。训练这个模型总共花了多少钱?557.6万美元。 用的是2048块英伟达H800芯片。
而同期,OpenAI训练GPT-4o用了多少?大约1亿美元,芯片数量是DeepSeek的8倍以上。Meta训练Llama 3.1用的算力,是DeepSeek的11倍。
行业里炸锅了。
但更猛的还在后面。
2025年1月20日晚,DeepSeek-R1发布。 数学、代码、推理能力,全面比肩OpenAI o1正式版。API定价是o1的三十分之一。
美国风投大佬马克·安德森直接发文,称这是"AI领域的斯普特尼克时刻"——硅谷突然意识到,太空竞赛那一页,好像又翻回来了。
英伟达单日市值蒸发5890亿美元。
这时候,美国那些邀请函开始雪片一样飞来了。他的回答依旧简洁:不去。DeepSeek给整个行业重写了一条规则,让美国科技圈相当难受。
他们多年来构建的逻辑是:你没有顶级芯片,你就没有顶级AI,你就没有资格跟我们玩。
梁文锋用行动告诉他们:规则是你们定的,但棋不一定非要按你们的下法走。但故事走到2026年,画风又变了。
美国持续收紧芯片出口管制,最新的Blackwell系列芯片完全买不到。英伟达在中国高端AI芯片市场的份额,从曾经的95%跌到了零。DeepSeek不得不开始一件极度痛苦的事:把整个底层代码从英伟达CUDA架构,整体迁移到华为昇腾芯片。
这不是换一块卡那么简单,这是把整栋楼的地基重新挖过。
2026年4月,DeepSeek-V4发布,率先在华为昇腾950上完成适配。英伟达CEO黄仁勋看完发布,罕见地公开表态:"基于国产芯片的顶级AI模型,对美国而言是一个糟糕的结果。"能让老黄说出这种话,已经说明了一切。
同月,DeepSeek宣布首次外部融资,估值超100亿美元。那个曾经挂断腾讯、阿里入股电话的梁文锋,开门了——但他开门的方式,是自己定估值、自己选时机、自己掌握节奏。
从始至终,他没有被任何人牵着走。
有人问梁文锋,为什么不去美国。
他没有正面回答,只是说过一句话:"技术创新永远是第一优先级,中国的AI不可能永远在跟随。"
一个广东小镇考出来的数学天才,用一支百人队伍,在芯片封锁的夹缝里,重新定义了全球AI赛道的游戏规则。
他的底气,从来不是来自硅谷,而是来自他自己。
【主要信源】
《DeepSeek创始人专访:中国的AI不可能永远在跟随,技术创新永远是第一优先级》,36氪·暗涌,2025年
《V4发布前的DeepSeek:特质、组织和梁文锋的独特目标》,晚点LatePost,2026年
