热搜上有一个Claude Opus 4.8蒸馏Qwen的话题,就是因为有人用中文问那个老问题「你是什么模型」时得到的回答是Qwen。
这个所谓的证据是典型到不能再典型的模型幻觉,跟蒸馏一点儿关系都没有,蒸馏也不是这么简单的判定标准。
再说了,如果Claude Opus 4.8这种水平的模型可以靠蒸馏实现,那简直天大的利好Anthropic,因为这意味着在同等的收入增速下训练成本可以降低一百倍以上,全世界所有的大模型厂商直接投降算了。
热搜上有一个Claude Opus 4.8蒸馏Qwen的话题,就是因为有人用中文问那个老问题「你是什么模型」时得到的回答是Qwen。
这个所谓的证据是典型到不能再典型的模型幻觉,跟蒸馏一点儿关系都没有,蒸馏也不是这么简单的判定标准。
再说了,如果Claude Opus 4.8这种水平的模型可以靠蒸馏实现,那简直天大的利好Anthropic,因为这意味着在同等的收入增速下训练成本可以降低一百倍以上,全世界所有的大模型厂商直接投降算了。