速報:GPT-5.6「Sol・Terra・Luna」登場 — Anthropic Mythos 5との競合構図と「なぜ今は使えないのか」

目次

この記事の要点

  • いつ・何が:OpenAIは2026年6月26日(米国時間)、次世代モデル群「GPT-5.6」を限定プレビューで発表したとしています。
  • 3階層:最上位フラッグシップの Sol、実務向けの Terra(GPT-5.5並みの性能を約半額と位置づけ)、低価格・高速の Luna の3モデル。数字(5.6)が世代、Sol/Terra/Luna が能力階層を表します。
  • 価格・提供:API料金は最上位Solで入力$5/出力$30(100万トークンあたり)から。当初はAPIとCodexでの限定提供で、ChatGPTやAPIの一般提供は数週間後(coming weeks)の予定とされます。
  • なぜ重要:OpenAIは全GPT-5.6モデルが内部評価でサイバー能力「High」に達したとし、米政府の要請で初期アクセスを承認パートナー(一部報道では約20社)に絞ったと報じられています。
  • 読者は何をすべきか:大半の読者はまだ直接は使えません。公表されたベンチマークはOpenAI・Anthropicそれぞれの自社評価である点に留意し、一般提供と続報を待つのが現実的です。

何が発表されたのか — GPT-5.6「Sol・Terra・Luna」3階層と新モード

OpenAIは2026年6月26日(米国時間)、次世代モデル群「GPT-5.6」を発表したとしています。今回は誰でもすぐ使える一般公開ではなく、対象を絞って先に提供する「限定プレビュー」での登場で、まずはAPIとコーディング支援ツール「Codex」を通じて提供されると説明されています(OpenAIヘルプ)。

特徴は、ひとつの世代を3つのモデルに分けたことです。最上位がSol、日常業務向けがTerra、低価格・高速がLunaという位置づけで、いずれもGPT-5.6世代に属します。

あわせて、より深く考える新しい推論努力「max」と、複数の補助エージェント(subagents)を並列で動かす「ultra」モードを新設したとされています(The Decoder)。難しい課題ほど時間や手数をかけて精度を上げる狙いとみられます。

3モデルの使い分けと性能ベンチ — Sol/Terra/Luna はどう違うか

役割分担は明確です。Sol は最上位で、新設のultra/maxに対応します。Terra はGPT-5.5並みの性能を約半額で提供すると位置づけられ、実務向けの主力です。Luna は低価格・高速で、大量処理や軽い用途に向くとみられます。

性能の目安として、コーディングやターミナル操作を測るベンチマーク(性能を比べる共通テスト)「TerminalBench 2.1」(CNET表記の Terminal-Bench 2.1 と同一指標)の数値が共有されています。

モデルTerminalBench 2.1(公表値)
GPT-5.6 Sol Ultra91.9%(OpenAIヘルプ系では91.91%)
GPT-5.6 Sol88.8%
Claude Mythos 5(Anthropic)88.0%
Claude Fable 5(Anthropic)84.3%
GPT-5.6 Terra84.3%

(出典:officechai

ただし重要な注意点があります。これらの数値はOpenAIが公表した自社評価であり、第三者による独立した検証ではありません。数値が近接している指標も多く、どちらのモデルが優れているかを現時点で断定はできません。

価格と使えるルート — いくらで、どこから利用できるのか

API料金(100万トークンあたり。トークンはAIが処理する文字のかたまりの単位)は次のとおりと報じられています。

モデル入力(/100万トークン)出力(/100万トークン)
GPT-5.6 Sol$5$30
GPT-5.6 Terra$2.50$15
GPT-5.6 Luna$1$6

(出典:9to5Mac

コスト面では「プロンプトキャッシュ」(繰り返し使う入力を再利用して費用を抑える仕組み)の仕様も変わりました。明示的なキャッシュ区切りと30分の最低保持に対応し、キャッシュへの書き込みは通常の入力料金の1.25倍、読み取りは入力料金の90%割引になるとされています(9to5Mac)。

提供ルートは段階的です。プレビュー期間はAPIとCodexでの限定提供で、ChatGPTやAPIの一般提供は数週間後(coming weeks)の予定。さらに2026年7月には、米半導体企業Cerebrasの基盤を使い毎秒最大750トークンを出す高速版を限定で開始する予定とされています(The Decoder)。

なぜ「限定プレビュー」なのか — サイバー能力と政府調整による段階公開

理由のひとつは安全性の分類です。OpenAIはGPT-5.6のサイバー能力を、自社の基準で「High」に分類したとしています。攻撃者の視点で弱点を探す検証(レッドチーミング)の結果、SolやTerraは脆弱性や攻撃の「部品」は見つけるものの、堅牢な標的に対して自律的に最後まで攻撃を完遂することはなく、最上位の「Critical」には未到達だったと説明されています(OpenAIシステムカード)。またOpenAIは、広く通用する脱獄(jailbreak=安全対策を回避させる手口)の探索に、A100(高性能GPU)換算で70万時間以上の計算資源を充てたと明記しています。

もうひとつが政府との調整です。OpenAIは発表前に計画と能力を米政府に伝え、参加状況を共有した「信頼できる少数のパートナー」にまず提供したとしています(TechCrunch)。一部報道では、政府が個別に名前を承認した約20社に絞られたとも伝えられています(The Next Web)。

一方でOpenAIは、この種の政府によるアクセス手続きが長期的な既定になるべきではなく、利用者・開発者・サイバー防御の担い手から最良の道具を遠ざけてしまう、とも主張しています(TechCrunch)。

Anthropic(Mythos 5・Fable 5)との競合構図 — いま両社の最上位モデルは使えるのか

GPT-5.6が比較対象に挙げるのが、Anthropicの Claude Mythos 5Fable 5 です。前掲のTerminalBench 2.1では、Mythos 5が88.0%、Fable 5が84.3%で、Sol(88.8%)やTerra(84.3%)と数値が近接しています。サイバー分野のベンチ「ExploitBench」では、SolがAnthropicの「Mythos Preview」と競争力のある結果を約3分の1の出力トークンで達成したとOpenAIは主張しています(自社評価。The Decoder)。

ただし、Anthropic側のモデルは現在アクセスが止まっています。Anthropicは2026年6月12日、米政府の輸出管理指令を受けてFable 5とMythos 5への全顧客アクセスを停止したと発表しました(Anthropic)。Anthropicは、当該の能力は競合モデルにも存在し正当な防御者も使うものだとして、このアクセス停止(リコール)の判断には反対の立場を表明しています。

両社の最上位モデルを並べると、現状は次のように整理できます。

項目GPT-5.6 Sol(OpenAI)Claude Mythos 5(Anthropic)
TerminalBench 2.1(公表値)88.8%(Sol Ultraは91.9%)88.0%
API料金(100万トークン)入力$5/出力$30入力$10/出力$50(二次報道)
現在の提供状況限定プレビュー(API・Codex先行、一般提供は coming weeks)2026年6月12日以降、米政府指令で全顧客アクセス停止中

(Mythos 5の価格は二次報道では一致するものの、Anthropic公式での直接確認は取れておらず「とされる」段階です。finout

つまり、両社とも政府が関わる形で最上位モデルへの一般アクセスが制限されており、利用者が今すぐ両者を直接使い比べて選べる状況ではありません。この点はベンチ数値以上に、今の読者にとって実際的な前提になります。

まとめ — 読者は何をすべきか/今後の見通し

今回のGPT-5.6は注目度の高い発表ですが、プレビューは限定提供のため、多くの読者は当面ChatGPTなど既存のモデルを使いながら様子を見るのが現実的です。

数値の読み方にも注意が必要です。前述のとおり、公表されているベンチマークはOpenAI・Anthropicそれぞれの自社評価や限定条件での結果であり、独立した検証はこれからです。どちらが優れているかを今の数字だけで断定せず、続報を待つのが妥当です。

今後追うべきポイントは3つです。①ChatGPTやAPIの一般提供がいつ始まるか、②7月に予定されるCerebras基盤の高速版、③米政府によるフロンティアAIの正式な評価プロセスの整備と、段階公開が今後どう変わっていくか。動きがあり次第、CODE.編集部で続報をお伝えします。

編集後記

今回いちばん印象に残ったのは、GPT-5.6とClaude Mythos 5が、性能の数字より先に「政府が関わる形で一般には届きにくい」という共通点でした。最先端を競う動きのすぐ隣で、安全性をめぐる調整が静かに進んでいるのだな、と少し立ち止まって考えてしまいました。私はベンチの勝ち負けよりも、一般提供がいつ来るのかを落ち着いて待ちたいと思います。

— CODE. 編集部

シェアいただけると励みになります!m(_ _)m
  • URLをコピーしました!
目次