万益资讯网

事情是这样的。前两天刷到数字生命卡兹克的一条内容,他说了一句话,大意是,他自己用

事情是这样的。

前两天刷到数字生命卡兹克的一条内容,他说了一句话,大意是,他自己用下来觉得产出效果最好的组合,是Claude的Chat模式+Opus 4.6。

📮对,不是Cowork,不是Claude Code,是Chat模式。

在Chat模式里面,其实也是可以调用Skill的。然后他排了个序,其次是Cowork+Opus 4.6,再其次是Claude Code+Opus 4.6,再其次是Claude Code+K2.5。其他的他基本就用的很少了。

📮他还说了一个我觉得特别有意思的点,Claude Opus 4.6产出的内容,很多都有幻觉,但同时幻觉又是创意的前提,所以他一般不会在Skill里面强行抑制幻觉,而是把AI生成的内容,扔给Codex+GPT-5.4,来检测是否含有事实不符的地方。

我当时看完这段话,愣了一下。不是因为这个结论有多惊人,而是因为,这不就是我一直在找的那个「灯塔」吗。

你想想看,我们这种做内容的人,每天面对的问题其实很具体。写一篇微博文案,从搜素材到整理事实到写初稿到去AI味到配图到交付,流程不复杂,但每一步都需要工具。

问题是,工具太多了。

Claude有Chat模式、有Cowork、有Code。智谱有GLM-5、有GLM-5-Turbo、有GLM-5V-Turbo。Google有Gemini CLI。OpenAI有GPT-5.4、有Codex。每个工具都说自己是最强的,每个博主都在推荐不同的组合。

你不亲自下场试一圈,根本不知道哪个真的能用,哪个只是跑分好看。

所以卡兹克那条内容,对我来说不是一个答案,是一个方向。

📮他给了我一个小灯塔,告诉我,嘿,这条路是通的,你顺着这个方向折腾,不会走偏。

因为有了这个灯塔,我才有了折腾的心。我先说我折腾了什么。

看完卡兹克那段话之后,我做了一件事,就是把所有工具都配置好了。Claude Chat+Opus 4.6,配好。智谱GLM 5V Turbo,配好。对应的Skill文件、MD文档、写作风格指南,全部同步到每一个工具里面。

为什么要全部同步?因为我想做一件事,控制变量。

同样的Skill,同样的写作风格指南,同样的用户画像文档,喂给不同的模型,然后看谁写出来的东西更好。

说真的,这个事儿挺有意思的,你们可以想象一下画面,一个汽车博主,深夜坐在电脑前,左边开着Claude,右边开着智谱,中间还开着一个Gemini CLI的终端窗口,三个AI同时写一篇文案,然后他像选秀导师一样给三个选手打分。

哈哈哈有点离谱,但我真的干了。对了,中间还有个插曲。

📮我一个朋友flypig说,Gemini CLI的文字能力很强,你可以试试加入对比。

我一听,行,加就加,反正都折腾了。于是我又花了半天时间把Gemini CLI也配好了,把同样的文档也喂进去。

结果呢?坦率的讲,Gemini CLI的文字能力确实不差,但跟Claude Opus 4.6一比,差距还是能感受到的。尤其是在中文语感和口语化表达这块,Claude明显更懂中国人说话的方式。Gemini CLI写出来的东西,怎么说呢,像一个中文说得很好的外国人写的。准确,规整,但是缺少那种「哈哈哈这人怎么跟我想的一样」的亲切感。

所以Gemini CLI在我这里,试完就放下了。不是不好,是不够适合我的场景。毕竟坐在电脑前的时间是有限的。

回到主线。

📮我最终日常在用的,就两个工具。Claude Chat+Opus 4.6,和智谱GLM 5V Turbo。先说Claude。

📮卡兹克说得没错,Claude Chat+Opus 4.6的文案产出能力,确实是目前我用过的所有工具里最好的。这个「最好」不是跑分意义上的最好,是实际干活意义上的最好。

你给它一个选题,给它你的写作风格指南,给它你的Skill文件,它写出来的东西,从结构到节奏到语气到用词,都能达到一个相当高的起点。你拿过来改一改,加点自己的真实经历和情绪,就能用。我之前写微博文案,从素材搜集到初稿完成,大概需要两到三个小时。现在用Claude Chat+Opus 4.6,这个时间压缩到了四十分钟左右。

注意,我说的是初稿。最后的润色、加人味、去AI腔、加真实经历,这些还是得自己来。AI帮我找的是弹药,但开枪的方向是我选的。但是。

这里有一个但是。📮我养的智谱GLM 5V Turbo,也真的好用。这个「养」字是关键。

你刚拿到一个新模型的时候,它就是个生瓜蛋子,写出来的东西中规中矩,你让它写微博文案,它给你写的像新闻稿。你让它口语化一点,它就在每句话后面加「哈哈」。

但是当你把你的Skill文件喂给它,把你的写作风格指南喂给它,把你的禁用词表喂给它,把你之前写过的好文案当作范例喂给它,然后跟它反复聊,反复改,反复打磨。

你敢信???它的能力会肉眼可见地变强。

我举个具体的例子。我们团队有个编辑,写一篇智能座舱横向评测文案,从素材整理到初稿完成,大概需要三天。我把同样的选题和素材扔给调教好的智谱GLM 5V Turbo。

它一下就PK掉了。

不是说我们编辑写得不好,而是在同等信息量输入的情况下,调教好的GLM 5V Turbo在文案结构、信息密度、可读性这几个维度上,确实已经达到了一个很高的水平。

📮当然,我横向对比下来,GLM 5V Turbo的文字能力跟Claude Opus 4.6比,还是要弱一些的。Claude在创意性、文字质感、情绪表达这几个维度上,依然是最强的。

但智谱有一个Claude没有的优势。它是国产的。我已经买了他的 max 年卡,所以呢,token 对我来说是无限的,而 Claude 呢,有封号的风险。

这意味着它对中文的理解,尤其是对中国互联网语境的理解,在某些细分场景下,会有一些Claude覆盖不到的优势。比如一些很本土化的梗、一些只有经常刷微博抖音的人才懂的表达方式,智谱有时候反而能拿捏得更准。

所以我现在的工作流是这样的。

日常写微博文案,Claude Chat+Opus 4.6是主力。遇到一些特别需要中文互联网语感的场景,或者需要快速出稿不用太精雕细琢的时候,智谱GLM 5V Turbo上场。这个呢,就是我开放了接口给同事们用,他们用的挺好

两个工具互相补位,各有擅长。聊到这里,我其实想说一个更大的感受。

📮这个事情里面,大模型本身的能力是一方面,你自己的Skill和调教才是另一方面。

你想想看,同样一个GLM 5V Turbo,在我手里能PK掉编辑三天的产出,在另一个人手里可能写出来的东西跟ChatGPT免费版差不多。

区别在哪?不在模型,在人。

在你有没有花时间去整理自己的写作风格指南,有没有花时间去沉淀自己的Skill文件,有没有花时间去一遍一遍地跟AI对话、修正、迭代。

我为了调教这套系统,前前后后花了大概两个月。从最早的写作风格速查表,到后来的卡兹克Skill文件,到禁用词列表,到哲学日记工作流,到微博文案标准工作流。每一个文档都是从几十篇真实文案里提炼出来的,每一条规则都是踩过坑之后总结的。

这些东西,才是真正的竞争力。模型会迭代,今天Claude Opus 4.6最强,明天可能就被别的模型超过了。但你沉淀下来的Skill、你的写作风格、你的禁用词表、你对自己内容调性的理解,这些东西是跟着你走的。

换一个模型,把这套东西喂进去,它照样能产出高质量的内容。

📮你跟AI聊得越多,它的能力就越强。但更准确的说法是,你跟AI聊得越多,你对自己的理解就越深。

因为你要教AI写出你的风格,你首先得搞清楚,你的风格到底是什么。你要告诉AI什么词不能用,你首先得知道,什么词一出现就会让你的文章变得不像你。你要给AI一个写作范例,你首先得从自己过去的几十篇文章里挑出来,哪些是你最满意的。

📮这个过程,就是输出倒逼输入。你以为你在训练AI,其实AI也在训练你。

好了不说了。为了写这篇文章,加上之前折腾工具的时间,我凌晨4点爬起来干了4个小时。

现在头是真疼。但是那种把所有工具都配好、跑通、对比完、心里有数的感觉,怎么说呢。这种感觉太爽了。值了。