月之暗面: 很早就验证过长思维链, 因成本高不够重视, 为了性能决定搞

新闻中心

您的位置：

绍兴网

月之暗面: 很早就验证过长思维链, 因成本高不够重视, 为了性能决定搞

2025-02-23 15:13:36

来源：

月之暗面: 很早就验证过长思维链, 因成本高不够重。视、, 为了性能决定搞

三言科技2月17日消息，上个月Kimi发布的多模态推理模型k1.5，今日月之暗面官方分享了k1.5模型诞生的过程。

月之暗面研究员FloodSung表示，去年9月12号OpenAIo1发布，长思维链（推理模型背后的关键技术）的有效让他陷入反思。

因为长思维链的有效性其实在一年多前就已经知道了，月之暗面Kimi联合创始人Tim周昕宇很早就验证过，使用很小的模型，训练模型做几十位的加减乘除运算，将细粒度的运算过程合成出来变成很长的思维链数据做监督微调，就可以获得非常好的效果。“我依然记得当时看到那个效果的震撼。”

“我们意识到长上下文的重要性，所以率先考虑把文本搞长，但却对长思维链这件事情不够重视。其实主要还是考虑了成本问题。”他表示，长上下文主要做的是长文本输入，有Prefill预填充，有Mooncake加持，成本速度可控，而长思维链是长文本输出，成本高很多，速度也要慢很多。在这种情况下，把输出搞长就没有成为一个高优选项。

该研究员称还有什么比性能更重要呢？成本和速度有摩尔定律加持，可以不断下降，只要把性能搞上去，剩下的都不是主要问题。“所以，我们得搞长思维链，搞o1。”

他还提到在实际训练的过程中有了重要的发现：模型会随着训练提升性能也不断增加token数，也就是这是RL训练过程中模型可以自已涌现的，“这个和友商Deepseek的发现几乎是一样的。”

美国近期为何航空事故频发温铁军谈如何解决城乡养老金差距大 3D兵马俑“出差”西安机场航站楼专家：普京谈判筹码在不断增加导演猥亵儿童被刑拘林高远1:3不敌张本智和怀化铁路警方查破1起拐卖儿童案件爱吃折耳根和酸奶的人都沉默了中国视协辟谣郑某峰为协会人员周深演唱会勇敢退场是因为敬畏

（内容来源：北青网）

作者： 编辑：黄嘉琪

绍兴网版权与免责声明：

① 凡本网注明“稿件来源：绍兴市新闻传媒中心”的所有文字、图片和音视频稿件，版权均属绍兴网所有，任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站，在下载使用时必须注明“稿件来源：绍兴网”，违者本网将依法追究责任。 ② 本网未注明“稿件来源：绍兴市新闻传媒中心”的文/图等稿件均为转载稿，本网转载出于传递更多信息之目的，并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用，必须保留本网注明的“稿件来源”，并自负版权等法律责任。如擅自篡改为“稿件来源：绍兴网”，本网将依法追究责任。如对稿件内容有疑议，请及时与我们联系。③ 如本网转载稿涉及版权等问题，请作者在两周内速来电或来函与绍兴网联系。（联系电话：0575-88624291 ）

越牛新闻客户端
越牛新闻微信
绍兴发布微信
越牛新闻微博
绍兴发布微博

爆料

新闻热线

0575-88880000

投稿信箱

zjsxnet@163.com