【DeepSeek发布新模型，它会像去年一样引起轰动吗？】中国DeepSeek

【DeepSeek发布新模型，它会像去年一样引起轰动吗？】

中国DeepSeek公司于周五发布了其备受期待的新模型预览版，承诺将与OpenAI、Anthropic和谷歌的模型一较高下。一年前，这家当时鲜为人知的初创公司曾席卷全球人工智能行业。

这家总部位于杭州的公司强调，新模型V4在推理能力和代理能力方面进行了重大升级，能够代表用户自主行动，例如编写代码。该公司还宣称，新模型具备增强处理大量令牌（AI模型用于理解指令的基本信息单元）效率的新能力。

DeepSeek在2025年推出突破性的R1模型后，一跃成为中国AI热潮的代表。该模型表现接近行业领先水平，而据称其成本仅为行业平均水平的一小部分。

这一突破性成功导致美国AI股暴跌，引发了人们对不断增加的数据中心建设投资的质疑。与此同时，它增强了人们对中国技术的信心，并加剧了与美国的科技竞赛。

但分析师表示，新模型不太可能像前代那样引发市场狂热。

“R1之所以震惊美国市场，是因为没人预料到中国模型能达到那个水平。V4只是延续了这一趋势，而趋势不会像突发事件那样成为头条新闻，”金融服务公司晨星（MorningStar）的高级股票分析师苏伊万（Ivan Su）表示。

苏补充道，股市已经反映出这样一个现实：像DeepSeek这样的中国AI模型具有竞争力，且使用成本低于美国同类产品，因此此次市场的反应将较为有限。

与DeepSeek早期的模型一样，V4是开源的，这意味着任何人都可以使用它，这与大多数美国模型不同。这种“开放”战略是中国旨在与美国竞争的关键渠道之一，通过快速扩大采用规模，并在从电子商务到机器人技术的各个领域推出实际应用。

该战略也反映了中国人工智能企业资金相对有限，以及在华盛顿出口管制下获取尖端芯片的限制。

为了克服这些限制，由于英伟达和AMD最先进的AI处理器仍难以企及，中国开发者不得不与国内芯片制造商合作。为了满足V4的计算需求，DeepSeek与中国科技巨头华为合作。华为周五在一份声明中表示，该公司通过将大量“昇腾950”芯片集群组合起来，利用其“超级节点”技术为这家AI初创公司提供支持，从而提供更强的计算能力。

市场分析公司Counterpoint Research首席分析师魏孙（Wei Sun）指出，与在英伟达硬件上训练的R1不同，V4运行在华为和另一家中国AI芯片制造商澎博（Cambricon）的国产芯片上。

他表示：“这使得人工智能系统的构建和部署不再完全依赖英伟达，这也是V4最终可能比R1产生更大影响的原因——它将加速国内市场的采用，并推动全球人工智能整体更快地发展。”

尽管Anthropic的Claude、OpenAI的ChatGPT和谷歌的Gemini等美国专有模型目前仍位居行业顶端，但中国企业在开源系统领域无疑占据主导地位。

DeepSeek在周五的一份声明中称，V4在开源模型中拥有最佳的代理编码能力，并具备“世界级”的推理能力。

该公司在一份研究论文中还表示，在广泛的世界知识方面，V4的表现优于其他开源模型，但同时也承认其仍落后于Gemini等行业领军者。

然而，DeepSeek自去年以来的崛起也伴随着质疑。Anthropic和OpenAI曾指控这家初创公司非法提取——或“蒸馏”——其模型的能力。

周四，白宫科技政策办公室主任迈克尔·克拉西奥斯（Michael Kratsios）也指责主要位于中国的外国实体开展“工业规模”的行动，试图从美国公司那里“提炼”前沿AI模型。尽管克拉西奥斯的备忘录并未直接点名DeepSeek，但在两大超级大国紧张局势持续的背景下，这再次将该公司置于聚光灯下。

CNN已联系DeepSeek，就这些指控寻求置评。

DeepSeek v4 百万上下文