2023年与2025年大语言模型训练对比，揭示了未来模型演进的关键转折：•

爱生活爱珂珂 2025-09-27 09:55:08

2023 年与 2025 年大语言模型训练对比，揭示了未来模型演进的关键转折：

• 2023 年训练主要分为两步：预训练（Pretraining）和后训练（Post-training），流程相对简单，数据混合和训练阶段较少。

• 2025 年训练加入了“中训练”（Midtraining）环节，显著丰富训练内容：

- 预训练阶段数据多样化，加入更多代码和合成数据，提升模型基础能力和代码理解力。

- 中训练阶段注重上下文扩展和强化推理能力，强化模型复杂任务处理能力。

- 后训练阶段细化为监督微调（SFT）和策略优化（DPO/RL），提升模型对复杂指令和反馈的适应性。

- 新增“模型合并”环节，实现不同模型优势融合，提升整体性能和泛化能力。

心得：

1. 未来训练更强调多阶段、多样化数据输入，基础能力和推理能力同步提升。

2. 中训练的加入打破传统两阶段框架，使模型在训练中期获得更丰富上下文理解。

3. 模型合并预示着多模型协同成为常态，单一模型训练渐退，融合策略将成性能提升关键。

2025 年训练流程更复杂但更高效，意味着大模型将跨越单一训练瓶颈，实现更智能、更灵活的表现。

大语言模型机器学习模型训练 AI发展人工智能

0 阅读：1

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

Dayflow：基于 AI 的 macOS 屏幕活动时间线生成工具，助你精准还原

2

《Embodied AI: From LLMs to World Models》

3

[LG]《Discovering Association Rules in Hi

4

[CL]《How Much of Your Data Can Suck? Thr

5

[LG]《Generative Model Inversion Through

6

[CL]《Thinking Augmented Pre-training》L W

7

早！[太阳] 早安

8

《The Hardware Knowledge that Every Progr

9

[CL]《Actions Speak Louder than Prompts:

10

[CL]《Pathways of Thoughts: Multi-Directi

热门分类

科技TOP

1

微信员工回应新iPhone提示空间不足早之前就有网友出现这个问题，要是还解决不了

2

史上最薄iPhoneiPhoneAir现场真机实拍这外观给几分？

3

重磅！华为公布多颗新昇腾芯片9月18日，在华为全连接大会2025上，华为轮值

4

荣耀不讲武德[捂脸哭]荣耀500系列这是要卷死友商，不仅全系标配2亿大底主摄，电池

5

一加新机Ace6系列曝光详细的硬件配置对比图和价格都有蓝厂X300和绿厂Fi

6

荣耀500系列曝光，全面对标苹果！荣耀500系列在工艺上完全对标苹果，中端机

7

不可思议！就在刚刚华为正式官宣了！9月4日，华为在深圳宣布：推出首款智慧屏M

8

荣耀Magic8标准版曝光，看着像是采用了4颗摄像头，然后是圆形的摄像头deco

9

当年米聊败给微信，是雷军判断错了这一点！雷军：我当初做米聊的时候，我认为腾讯一

10

鸿蒙NEXTMate80最强配置，据博主爆料，十大黑科技，每一项都是吊炸天，

科技最新文章

1

有一说一，荣耀数字系列的性价比和综合配置真的很顶。荣耀400系列凭借出色的颜值

2

虚假的对标iPhone：名字对标、外观对标真正的对标iPhone：影像对标、系

3

被吹上天的荣耀X70，说说掏窝子的话，不要轻易去上手，因为我就是去看了，没忍住…

4

几乎没有短板的手机推荐，荣耀Magic6pro依旧很吃香，搭载骁龙8Gen3芯片

5

荣耀500系列曝光，全面对标苹果！荣耀500系列在工艺上完全对标苹果，中端机

6

当各家都开心官宣最新款旗舰手机要搭载高通骁龙新处理器的时候，冒出来一位另类选手那

7

这可能是今晚的金句之王了：“我的朋友陈年是我直播间的榜一大哥，但今晚的发布会我没

8

小米17价格果然小米数字旗舰大家都喜欢，看了一下现在各平台已经卖断货了？小米1

9

小米17Pro背屏游戏壳iPhone实现不了了雷总给实现了！这波回忆杀太顶了。小

10

Magic8黑边更窄了据说Magic8的黑边区域也做到了1.1mm左右的宽度，