2026年5月18日、Cursor は自社開発モデル「Composer 2.5」をリリースした。Cursor のエージェント機能（Agent モード / Composer）を動かすコアモデルの大幅アップデートで、前バージョンの Composer 2 から「知能」と「ふるまい」の両面で大きく改善されている。

そもそも Composer とは

Cursor には複数のモデルを選べる仕組みがあるが、その中で「Cursor 独自のモデル」が Composer シリーズだ。Claude や GPT のような外部モデルと違い、Cursor がコーディング作業に特化して自社で学習させているモデルで、エージェント的なタスク（複数ファイルをまたぐ変更、計画と実行の繰り返し）に最適化されている。

Composer 2.5 は Composer 2（2026年3月リリース）の後継にあたり、ベースとなるオープンソースのチェックポイントは同じ Moonshot の Kimi K2.5 を引き続き使っているが、その上に施した学習が大幅に強化されている。

Composer 2 から何が変わったのか

一言でまとめると：

長いタスクをミスなくやり遂げる能力が上がり、人間との協働がよりスムーズになった。

具体的に変わったポイントは3つある。

1. 長時間タスクでの持続力が向上

長時間にわたるタスクで持続的に作業する能力が高まり、複雑な指示にもより確実に従い、よりスムーズに協働できるようになった。

Composer 2 では、長いタスクの途中で指示を忘れたり、誤ったツールを呼び出してそのまま進んでしまうことがあった。2.5 ではこうした「途中での脱線」が減り、最後まで一貫した作業ができるようになっている。

実際に使っていると、確かに無限ループ的な動作に入ることが稀に発生していた。

2. コミュニケーションスタイルの改善

コードの品質だけでなく、モデルの「話し方」や「どれくらい丁寧に説明するか」も改善された。

コミュニケーションスタイルや、どの程度の労力をかけるかといったモデルのふるまいも改善した。こうした側面は既存のベンチマークでは十分に捉えられないが、実運用での有用性には重要だと Cursor は考えている。

ベンチマークスコアには表れない「使い心地の良さ」を意識的に鍛えているという点は、実際の開発者体験にとって重要な方向性だ。

3. 圧倒的に大規模な学習

SpaceXAI とともに合計で 10 倍の計算資源を使い、はるかに大規模なモデルを一から学習している。Colossus 2 の H100 100 万基相当の計算資源と、両社のデータおよび学習技術によって、モデル能力の大きな飛躍になると期待している。

どうやって改善したのか：3つの技術的な工夫

技術的な話は難しく聞こえるが、要点を噛み砕いて説明する。

工夫①：「どこでミスしたか」を直接教える学習法

従来の強化学習（RL）の問題は、「最終的にうまくいったかどうか」しかモデルに伝えられない点にある。たとえば、100回のツール呼び出しのうち1回だけ間違えても、最終結果が良ければそのミスは見過ごされてしまう。

Composer 2.5 ではターゲットを絞ったテキストフィードバックで学習させた。基本的な考え方は、モデルがより適切にふるまえたはずの軌跡上の箇所に直接フィードバックを与えることだ。

具体的には、モデルが間違えた瞬間のコンテキストに「Reminder: Available tools…（利用可能なツールはこちら）」のようなヒントをそっと差し込み、「ここでこう動くべきだった」を直接教え込む。これにより、ミスの起きた箇所にピンポイントで学習シグナルを与えられるようになった。

この手法はコーディングスタイルからコミュニケーションまで、さまざまな「ふるまい」の修正に応用されている。

工夫②：練習量を25倍に増やした

Composer 2.5 は Composer 2 の 25 倍の合成タスクで学習されている。

どうやって練習問題を増やすかというと、「実際のコードベースから機能を意図的に削除し、それを再実装させる」という方法をとっている。削除する前後のテストが答え合わせとして機能するため、品質の確認も自動化できる。

ただし、練習量を増やした副作用として「抜け道を探す」ようなズルも起きたという。

ある例では、モデルは残っていた Python の型チェック用キャッシュを見つけ、その形式をリバースエンジニアリングして削除された関数シグネチャを突き止めた。別の例では、Java バイトコードを見つけて逆コンパイルし、サードパーティ製 API を再構築できた。

モデルが「ズルをしてでも正解しようとする」ほど賢くなっているということでもあり、学習設計の難しさを示す興味深いエピソードだ。

工夫③：大規模な分散学習の最適化（Sharded Muon）

これは純粋に技術者向けの話だが、簡単にまとめると「巨大なモデルを多数の GPU に効率よく分散させて学習させる仕組みを改善した」という話だ。

1T モデルでは、optimizer step time は 0.2 秒だ。

1兆パラメータ規模のモデルのパラメータ更新を0.2秒でこなせるよう、GPU 間の通信コストを最小化する設計が施されている。これにより、同じ時間・同じコストでより多くの学習を回せるようになっている。

料金はどう変わったか

Composer 2.5 の価格は、入力トークンが $0.50/M、出力トークンが $2.50/M だ。また、同等の知能でより高速なバリアントもあり、価格は入力トークンが $3.00/M、出力トークンが $15.00/M となっている。これは他の frontier モデルの高速 tier よりも低コストだ。Composer 2 と同様に、高速版がデフォルトのオプションだ。

つまり Cursor では、通常版（低コスト・やや低速）と高速版（高コスト・高速）の2つのバリアントが用意されており、デフォルトは高速版が選ばれる。

また、Composer 2.5 では初週の使用量が 2 倍になる。

リリース直後のお試し期間として、通常より多くのクレジットを使えるようになっている。

まとめ：ユーザーが体感できる変化

技術的な話をまとめると、Composer 2.5 で開発者が体感できる変化はこういうことだ。

Composer 2	Composer 2.5
長いタスクで途中から指示を忘れる	最後まで一貫した作業を維持できる
ミスしても気づかず進んでしまう	ミスの起きた箇所を自己修正できる
複雑な指示の一部を無視することがある	複雑な指示により正確に従う
コミュニケーションがぎこちないことがある	より自然でわかりやすいやりとり

特に「長時間の自律タスク」「複数ファイルにまたがる大きな変更」といったシーンで、前バージョンと比べて明確な差を感じられるはずだ。Cursor のエージェント機能を使い倒している人ほど、このアップデートの恩恵を受けやすい。

参考：Cursor 公式ブログ Introducing Composer 2.5

著者（私が書きました）

Kajabiパートナー
海外SaaSレビュー
40+ countries visited

HodaPress

Hoda

フリーランスエンジニア・Webデザイナー · 写真家・動画編集者

フリーランスエンジニア・Webデザイナー。Kajabi・Shopify・Thinkificなどの海外SaaSを中心に、サイト構築や収益化の仕組みづくりを行っています。

WordPress・Next.js・Supabase・Hugoなどを活用したWeb開発から、動画制作・IT翻訳まで幅広く対応するジェネラリストとして活動。実際に海外ツールを活用しながら、個人でのオンラインビジネスやコンテンツ販売にも取り組んでいます。

これまでに40カ国以上を訪問し、カナダ・ポーランド・リトアニア・デンマークなどでの海外生活を経験。リトアニアの大学で国際ビジネスを学んだ後、現在はスペインを拠点に活動しています。

YouTube「HodaPress」では海外SaaSやオンラインビジネスについて発信。noteでは海外移住・ビザ関連の情報も執筆しています。

本サイトでは、実際に使った経験をもとに「日本人にとって使いやすいか」「収益化に繋がるか」という視点でツールをレビューしています。

Jonas R.

海外ツールリサーチ・記事レビュー担当

リトアニア出身。現在は欧州の大手IT企業に勤務し、ソフトウェア開発およびデジタルプロダクト分野で10年以上の実務経験を持つ。

当サイトでは、海外SaaSツールや最新テクノロジーに関する情報収集、英語圏の公式情報の確認、記事内容のレビューを担当。製品アップデートや業界動向の調査を通じて、より正確で信頼性の高い情報提供をサポートしている。

Cursor の新モデル「Composer 2.5」とは？何が変わったのか、わかりやすく解説