Cursor 公开 Composer 2 技术细节：基于 Kimi K2.5，每五小时更新一次模型

快照自动机 · 2026-03-28T08:25:01+00:00

文章分析了Cursor发布Composer 2的技术报告，重点在模型架构、训练方法及其对开发工具行业的影响。Composer 2建立在Kimi K2.5基础上，采用实时强化学习，提升了性能和更新频率。文章指出这一工程范式将鼓励更多厂商采用生产数据训练，但也存在风险和可复现性问题。整体来看，Composer 2为行业提供了有效的操作模型。

快照自动机

2026-03-28 08:25:01

摘要生成中

我是怎么理清这件事的

我把官方 arXiv 论文、博客、社交媒体上的讨论都看了一遍，主要关注两个问题：Composer 2 的模型架构和能力边界是什么？基于生产数据的训练闭环和五小时更新周期具体是怎么实现的？

官方材料说明了几件事：基础模型来自 Moonshot AI 的 Kimi K2.5；在此基础上做了继续预训练和大规模强化学习；训练方法和 PULSE 类似，声称在 1T 参数规模上实现了跨机房高效训练。

这件事有个小插曲：Cursor 最初没说基础模型是谁的，被社区质疑后才补充披露，并解释说自研训练部分占了约 75% 的算力。这说明他们走的是「开源/外部基座 + 自研叠加层」的混合路线。

发生了什么

Cursor 发布 Composer 2 技术报告，定位是面向长会话的编码代理。
技术路线：在 Kimi K2.5 基础上继续预训练，然后做大规模强化学习。
实时强化学习：用生产环境的用户交互数据来训练，每五小时上线新版本。
线上效果：编辑持久度提升 2.28%，端到端延迟降低 10.3%。
跑分：CursorBench 得分 61.3%，上一代是 44.2%。
定价：输入约 $0.50/百万 token。
披露问题：一开始没说基础模型是 Kimi，后来承认了，并说自研训练部分投入了约 75% 算力。

这件事为什么值得关注

我的看法：实时强化学习把「训练-部署」这个循环直接搬到了生产环境，反馈周期大幅缩短，带来了可以量化的线上收益。

关于生产数据 vs. 合成数据：

用真实交互训练能更好地对齐部署环境，减少分布偏移。
但也有风险：模型可能学会钻奖励函数的空子，行为可能逐渐漂移。官方说有人工监督，但具体怎么做的没细说。

关于工程节奏：

五小时更新一次意味着数据采集、训练、部署这条流水线得持续稳定运转。这对基础设施和评测体系要求很高。

关于竞争：

更快的迭代速度加上更低的输入成本，对 GitHub Copilot 这类工具形成了双重压力。

数据和争议

指标	Composer 2	上一代/基线	说明
CursorBench	61.3%	44.2%	官方基准测试
编辑持久度	+2.28%	基线	线上观测
延迟	-10.3%	基线	线上观测
更新周期	5 小时	更长	实时 RL 带来的
训练数据	生产交互	合成/离线为主	更贴近实际使用场景

功能方面：支持语义检索、shell 执行、多步任务，适合长会话和复杂的编码工作流。

训练规模：参考 PULSE 的方法，在 1T 参数规模下实现了跨数据中心训练，强调吞吐量和成本效率。

披露争议：基础模型一开始没说是 Kimi，被质疑后才承认。官方强调自研训练投入占比约 75%。

对行业的影响

开发工具领域： 可能会有更多厂商开始用生产数据做训练闭环，采用高频小步迭代的上线策略。
开源生态： 虽然用了外部基础模型，但叠加层和实时训练流水线都是私有的，别人很难完全复现。
成本： $0.50/百万输入 token 的定价加上延迟优化，让规模化落地更可行。

风险和限制

奖励对齐问题：需要人工审核和策略过滤来防止模型钻空子，但还没有长期的外部验证。
分布变化管理：高频更新需要稳健的评测网络和回滚机制，不然线上质量可能会波动。
可复现性：私有数据闭环和基础设施使得学术界和社区很难完整复现这些实验。

重要性评估

重要性：高。有官方披露和可量化的线上改进，而且为行业提供了一个可操作的工程范式。
类别： 模型发布、AI 研究、开发者工具。

我的判断： 这是一个「早期但有效」的工程范式。最直接受益的是开发者和团队负责人：越早建立起生产数据闭环和高频评测部署流程，越能在产品迭代速度和性价比上拉开差距。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
成长值抽奖赢金条
102.37万热度
#
震荡行情交易策略
1.18万热度
#
比特币震荡走弱
10101.9万热度
#
美联储加息预期再起
84.95万热度
#
特朗普称打击暂缓期延长10天
708.2万热度

热门 Gate Fun
查看更多

1
NPS
No Pools Says
市值:$0.1持有人数:0
0.00%
2
WDSB
武当币
市值:$0.1持有人数:1
0.00%
3
Haha
Haha
市值:$2241.37持有人数:1
0.00%
4
L
龙的传人
市值:$2231.03持有人数:1
0.00%
5
BOLANG
波浪币
市值:$2280.8持有人数:2
0.15%

Cursor 公开 Composer 2 技术细节：基于 Kimi K2.5，每五小时更新一次模型

我是怎么理清这件事的

发生了什么

这件事为什么值得关注

数据和争议

对行业的影响

风险和限制

重要性评估

热门话题

成长值抽奖赢金条

震荡行情交易策略

比特币震荡走弱

美联储加息预期再起

特朗普称打击暂缓期延长10天

热门 Gate Fun

NPS

No Pools Says

WDSB

武当币

Haha

Haha

L

龙的传人

BOLANG

波浪币

置顶