万益资讯网

【DeepSeek发布新模型,它会像去年一样引起轰动吗?】 中国DeepSeek

【DeepSeek发布新模型,它会像去年一样引起轰动吗?】

中国DeepSeek公司于周五发布了其备受期待的新模型预览版,承诺将与OpenAI、Anthropic和谷歌的模型一较高下。一年前,这家当时鲜为人知的初创公司曾席卷全球人工智能行业。

这家总部位于杭州的公司强调,新模型V4在推理能力和代理能力方面进行了重大升级,能够代表用户自主行动,例如编写代码。该公司还宣称,新模型具备增强处理大量令牌(AI模型用于理解指令的基本信息单元)效率的新能力。

DeepSeek在2025年推出突破性的R1模型后,一跃成为中国AI热潮的代表。该模型表现接近行业领先水平,而据称其成本仅为行业平均水平的一小部分。

这一突破性成功导致美国AI股暴跌,引发了人们对不断增加的数据中心建设投资的质疑。与此同时,它增强了人们对中国技术的信心,并加剧了与美国的科技竞赛。

但分析师表示,新模型不太可能像前代那样引发市场狂热。

“R1之所以震惊美国市场,是因为没人预料到中国模型能达到那个水平。V4只是延续了这一趋势,而趋势不会像突发事件那样成为头条新闻,”金融服务公司晨星(MorningStar)的高级股票分析师苏伊万(Ivan Su)表示。

苏补充道,股市已经反映出这样一个现实:像DeepSeek这样的中国AI模型具有竞争力,且使用成本低于美国同类产品,因此此次市场的反应将较为有限。

与DeepSeek早期的模型一样,V4是开源的,这意味着任何人都可以使用它,这与大多数美国模型不同。这种“开放”战略是中国旨在与美国竞争的关键渠道之一,通过快速扩大采用规模,并在从电子商务到机器人技术的各个领域推出实际应用。

该战略也反映了中国人工智能企业资金相对有限,以及在华盛顿出口管制下获取尖端芯片的限制。

为了克服这些限制,由于英伟达和AMD最先进的AI处理器仍难以企及,中国开发者不得不与国内芯片制造商合作。为了满足V4的计算需求,DeepSeek与中国科技巨头华为合作。华为周五在一份声明中表示,该公司通过将大量“昇腾950”芯片集群组合起来,利用其“超级节点”技术为这家AI初创公司提供支持,从而提供更强的计算能力。

市场分析公司Counterpoint Research首席分析师魏孙(Wei Sun)指出,与在英伟达硬件上训练的R1不同,V4运行在华为和另一家中国AI芯片制造商澎博(Cambricon)的国产芯片上。

他表示:“这使得人工智能系统的构建和部署不再完全依赖英伟达,这也是V4最终可能比R1产生更大影响的原因——它将加速国内市场的采用,并推动全球人工智能整体更快地发展。”

尽管Anthropic的Claude、OpenAI的ChatGPT和谷歌的Gemini等美国专有模型目前仍位居行业顶端,但中国企业在开源系统领域无疑占据主导地位。

DeepSeek在周五的一份声明中称,V4在开源模型中拥有最佳的代理编码能力,并具备“世界级”的推理能力。

该公司在一份研究论文中还表示,在广泛的世界知识方面,V4的表现优于其他开源模型,但同时也承认其仍落后于Gemini等行业领军者。

然而,DeepSeek自去年以来的崛起也伴随着质疑。Anthropic和OpenAI曾指控这家初创公司非法提取——或“蒸馏”——其模型的能力。

周四,白宫科技政策办公室主任迈克尔·克拉西奥斯(Michael Kratsios)也指责主要位于中国的外国实体开展“工业规模”的行动,试图从美国公司那里“提炼”前沿AI模型。尽管克拉西奥斯的备忘录并未直接点名DeepSeek,但在两大超级大国紧张局势持续的背景下,这再次将该公司置于聚光灯下。

CNN已联系DeepSeek,就这些指控寻求置评。

DeepSeek v4 百万上下文