2026.03.05

AIが数学の未解決問題を証明｜フィールズ賞受賞者も認めた形式検証の衝撃

2026年1月、AIを用いた数学研究に関するニュースが大きな注目を集めました。OpenAIのモデル「GPT-5.2 Pro」と形式証明支援AIが協働し、エルデシュ問題の一部に対する新しい解が提示されたと報じられたのです。フィールズ賞受賞者のテレンス・タオ氏がこの成果を認めたことで、AI技術の到達点が改めて注目を集めています[1]。しかし、この出来事が示す真の意味は、単なるAIの計算能力の向上ではありません。「形式検証」という技術が、数学という学問領域にもたらす構造的変化こそが本質なのです。

AIによる数学問題解決の実態

エルデシュ問題#728の解決

2026年1月、GPT-5.2 ProとHarmonic社の形式証明支援AI「Aristotle」が協働し、エルデシュ問題#728を解決しました[1]。エルデシュ問題とは、20世紀を代表する数学者ポール・エルデシュが提起した1,000以上の未解決問題群のことです[2]。タオ氏は、この成果を「ほぼ自律的にAIがエルデシュ問題を解いた最初の事例」と評価しています。

同時期に複数の問題が解決されました。問題#397は量的研究者のニール・ソマニがGPT-5.2 Proを使用して反証し、タオ氏自身が1日以内に検証しました[3]。問題#124はAristotle AIが6時間で解決し、検証にはわずか1分しかかかりませんでした[4]。この驚異的なスピードは、AIの数学能力の向上を示す明確な証拠となっています。

テレンス・タオ氏が明かす真実

しかし、タオ氏自身はこれらの成果について極めて慎重な評価を下しています。GitHubページ「AI contributions to Erdős problems」では、AIによる解決の実態が詳細に記録されています[2]。最も重要な指摘は、エルデシュ問題の難易度が「数桁の差」で異なるという事実です。

実際、AIが「解決」したとされる問題の多くは、実は過去の文献で既に人間によって解決済みだったことが後から判明しています[5]。タオ氏の推定によれば、現在のAIツールが最小限の人間の助けで解決できるエルデシュ問題は、全体のわずか1～2%程度に過ぎません[6]。つまり、50年間未解決だった問題は「誰も真剣に取り組まなかった」だけであり、AIは数学における「忘れられた問題」の再発見装置として機能しているのです。

形式検証という技術革新

Leanが可能にした機械検証

AIによる数学問題解決を可能にしているのが、「Lean」という証明支援言語です[7]。Leanは、数学の証明を機械が検証可能な形式に変換する技術で、Microsoft Researchが開発しました[8]。従来の数学論文では証明は自然言語で記述され、人間の査読者が正しさを判断していましたが、Leanでは各ステップが厳密に形式化され、コンピュータが論理的正しさを検証します。

2021年、Leanはフィールズ賞受賞者ピーター・ショルツの凝縮数学の証明を検証し、その信頼性が実証されました[7]。現在、Leanの数学ライブラリ「Mathlib」は100万行を超えるコードで構成され、純粋数学の大部分をデジタル化しています[9]。この膨大な知識ベースにより、AIは既存の数学知識を参照しながら新しい証明を構築できるのです。

数学の民主化への道

形式検証技術の真価は、数学の民主化にあります。Microsoft Researchは、Leanプロジェクトの目標を「数学の民主化」と「数学研究の最前線の加速」と定義しています[8]。従来、最高レベルの数学は少数の天才によって占められ、ピアレビューによる信頼のボトルネックが新しい探求を阻害していました。

Leanは、数学をデジタル化し、コンピュータが定理を検証できるようにすることで、このボトルネックを解消します。誰でも（そしてAIでも）数学的発見に貢献でき、その正しさが機械的に保証される世界が到来しつつあるのです。タオ氏は、未解決の数学問題が「長いしっぽの分布」に従うと指摘しており[5]、AIはこの「しっぽ」の部分を体系的に探索できる唯一のツールとなっています。

ビジネスへの応用可能性

金融・エンジニアリング分野での活用

形式検証技術は、数学研究だけでなく、実務領域への応用が期待されています。B Capitalのパートナーは、量的取引におけるアルファ発見、ソフトウェアとプロトコルの検証、エンジニアリング、最先端の科学研究など、数兆ドル規模の分野では「論理の明瞭性と正確性の確実性が不可欠」だと指摘しています[10]。ブラックボックスの推論は、どれほど説得力があっても、結果を伴う決定を導くために完全に信頼することはできません。

AWSは既に、認可ポリシー言語「Cedar」の検証にLeanを活用しています[11]。実行可能なモデルをLeanで作成し、セキュリティプロパティを証明し、本番コードと照合することで、高い保証を最小限のランタイムオーバーヘッドで実現しています。これは、形式検証が重要なソフトウェアの検証に実用可能であることを示す実例です。

Axiomが示す未来像

スタートアップAxiomは、形式検証技術の商業化において先駆的な存在です。24歳の創業者カリナ・ホンは、Stanford大学を中退してこの会社を立ち上げ、6,400万ドルの資金調達に成功しました[12]。Axiomは、数学専用言語Leanを用いて証明を検証できるAIシステム「AxiomProver」を開発しており、既存の文献を検索するだけでなく、未解決の問題を解くための全く新しいアプローチを生み出すことができます[13]。

注目すべきは、AxiomのAIシステムがPutnamレベルの問題に対して高い解答能力を示した点です。Axiomは2025年のPutnam問題を用いた実験で120点満点中90点相当のスコアを報告しています。一方、実際の2025年Putnamコンペティションでは人間の最高得点は110点であり、AIの結果は公式大会の順位とは直接比較できないものの、その潜在能力を示す例として注目されています。

この成果は、形式検証と自然言語を組み合わせることで、より少ない計算リソースでより強力なパフォーマンスを達成できることを実証しています。Axiomは、金融、航空機設計、チップ設計、量的取引など、厳密な計算精度を必要とする分野での実用化を目指しています[13]。

さいごに

AIが数学の未解決問題を解いているというニュースの裏には、形式検証という地味だが強力な技術革新が存在します。この技術は、数学を機械が理解できる形式に変換し、証明の正しさを保証することで、知識の品質と民主化を同時に実現しています。

ビジネスの世界では、意思決定の正確性と説明可能性がますます重要になっています。形式検証技術は、金融取引、ソフトウェア開発、エンジニアリングなど、高度な論理的推論を必要とする分野において、AIの「信頼できるパートナー」としての地位を確立する鍵となるでしょう。テレンス・タオ氏の冷静な評価が示すように、現在のAIはまだ真に困難な問題を解くには至っていません。しかし、体系的に知識を蓄積し、形式的に検証された解を提供することで、人間の専門家を補完する強力なツールとして進化し続けています。

今後、形式検証技術がどのように発展し、ビジネス領域に浸透していくのか、注目に値する動向です。