2026年5月18日、Cursor は自社開発モデル「Composer 2.5」をリリースした。Cursor のエージェント機能(Agent モード / Composer)を動かすコアモデルの大幅アップデートで、前バージョンの Composer 2 から「知能」と「ふるまい」の両面で大きく改善されている。
そもそも Composer とは
Cursor には複数のモデルを選べる仕組みがあるが、その中で「Cursor 独自のモデル」が Composer シリーズだ。Claude や GPT のような外部モデルと違い、Cursor がコーディング作業に特化して自社で学習させているモデルで、エージェント的なタスク(複数ファイルをまたぐ変更、計画と実行の繰り返し)に最適化されている。

Composer 2.5 は Composer 2(2026年3月リリース)の後継にあたり、ベースとなるオープンソースのチェックポイントは同じ Moonshot の Kimi K2.5 を引き続き使っているが、その上に施した学習が大幅に強化されている。
Composer 2 から何が変わったのか
一言でまとめると:
長いタスクをミスなくやり遂げる能力が上がり、人間との協働がよりスムーズになった。
具体的に変わったポイントは3つある。
1. 長時間タスクでの持続力が向上
長時間にわたるタスクで持続的に作業する能力が高まり、複雑な指示にもより確実に従い、よりスムーズに協働できるようになった。
Composer 2 では、長いタスクの途中で指示を忘れたり、誤ったツールを呼び出してそのまま進んでしまうことがあった。2.5 ではこうした「途中での脱線」が減り、最後まで一貫した作業ができるようになっている。
実際に使っていると、確かに無限ループ的な動作に入ることが稀に発生していた。
2. コミュニケーションスタイルの改善
コードの品質だけでなく、モデルの「話し方」や「どれくらい丁寧に説明するか」も改善された。
コミュニケーションスタイルや、どの程度の労力をかけるかといったモデルのふるまいも改善した。こうした側面は既存のベンチマークでは十分に捉えられないが、実運用での有用性には重要だと Cursor は考えている。
ベンチマークスコアには表れない「使い心地の良さ」を意識的に鍛えているという点は、実際の開発者体験にとって重要な方向性だ。
3. 圧倒的に大規模な学習
SpaceXAI とともに合計で 10 倍の計算資源を使い、はるかに大規模なモデルを一から学習している。Colossus 2 の H100 100 万基相当の計算資源と、両社のデータおよび学習技術によって、モデル能力の大きな飛躍になると期待している。
どうやって改善したのか:3つの技術的な工夫
技術的な話は難しく聞こえるが、要点を噛み砕いて説明する。
工夫①:「どこでミスしたか」を直接教える学習法
従来の強化学習(RL)の問題は、「最終的にうまくいったかどうか」しかモデルに伝えられない点にある。たとえば、100回のツール呼び出しのうち1回だけ間違えても、最終結果が良ければそのミスは見過ごされてしまう。
Composer 2.5 ではターゲットを絞ったテキストフィードバックで学習させた。基本的な考え方は、モデルがより適切にふるまえたはずの軌跡上の箇所に直接フィードバックを与えることだ。
具体的には、モデルが間違えた瞬間のコンテキストに「Reminder: Available tools…(利用可能なツールはこちら)」のようなヒントをそっと差し込み、「ここでこう動くべきだった」を直接教え込む。これにより、ミスの起きた箇所にピンポイントで学習シグナルを与えられるようになった。
この手法はコーディングスタイルからコミュニケーションまで、さまざまな「ふるまい」の修正に応用されている。
工夫②:練習量を25倍に増やした
Composer 2.5 は Composer 2 の 25 倍の合成タスクで学習されている。
どうやって練習問題を増やすかというと、「実際のコードベースから機能を意図的に削除し、それを再実装させる」という方法をとっている。削除する前後のテストが答え合わせとして機能するため、品質の確認も自動化できる。
ただし、練習量を増やした副作用として「抜け道を探す」ようなズルも起きたという。
ある例では、モデルは残っていた Python の型チェック用キャッシュを見つけ、その形式をリバースエンジニアリングして削除された関数シグネチャを突き止めた。別の例では、Java バイトコードを見つけて逆コンパイルし、サードパーティ製 API を再構築できた。
モデルが「ズルをしてでも正解しようとする」ほど賢くなっているということでもあり、学習設計の難しさを示す興味深いエピソードだ。
工夫③:大規模な分散学習の最適化(Sharded Muon)
これは純粋に技術者向けの話だが、簡単にまとめると「巨大なモデルを多数の GPU に効率よく分散させて学習させる仕組みを改善した」という話だ。
1T モデルでは、optimizer step time は 0.2 秒だ。
1兆パラメータ規模のモデルのパラメータ更新を0.2秒でこなせるよう、GPU 間の通信コストを最小化する設計が施されている。これにより、同じ時間・同じコストでより多くの学習を回せるようになっている。
料金はどう変わったか
Composer 2.5 の価格は、入力トークンが $0.50/M、出力トークンが $2.50/M だ。また、同等の知能でより高速なバリアントもあり、価格は入力トークンが $3.00/M、出力トークンが $15.00/M となっている。これは他の frontier モデルの高速 tier よりも低コストだ。Composer 2 と同様に、高速版がデフォルトのオプションだ。
つまり Cursor では、通常版(低コスト・やや低速)と高速版(高コスト・高速)の2つのバリアントが用意されており、デフォルトは高速版が選ばれる。
また、Composer 2.5 では初週の使用量が 2 倍になる。
リリース直後のお試し期間として、通常より多くのクレジットを使えるようになっている。
まとめ:ユーザーが体感できる変化
技術的な話をまとめると、Composer 2.5 で開発者が体感できる変化はこういうことだ。
| Composer 2 | Composer 2.5 |
|---|---|
| 長いタスクで途中から指示を忘れる | 最後まで一貫した作業を維持できる |
| ミスしても気づかず進んでしまう | ミスの起きた箇所を自己修正できる |
| 複雑な指示の一部を無視することがある | 複雑な指示により正確に従う |
| コミュニケーションがぎこちないことがある | より自然でわかりやすいやりとり |
特に「長時間の自律タスク」「複数ファイルにまたがる大きな変更」といったシーンで、前バージョンと比べて明確な差を感じられるはずだ。Cursor のエージェント機能を使い倒している人ほど、このアップデートの恩恵を受けやすい。
参考:Cursor 公式ブログ Introducing Composer 2.5

