Google DeepMindが開発した新フレームワーク「AlphaProof Nexus」は、複雑さの異なる4種類のエージェントを組み合わせ、数十年来の数学的難問を数百ドルのコストで解決することに成功した。組合せ論や凸最適化、整数論などの分野で成果を上げ、量子光学やグラフ理論の実研究にも活用されている。
Google DeepMindが開発した新フレームワーク「AlphaProof Nexus」は、純粋な自然言語処理とは異なるアプローチを採用している。このシステムは解答を生成するのではなく、形式的な証明スケッチを出力する。
システムは複雑さが段階的に異なる4種類のエージェント変種で構成されている。最もシンプルなAgent(A)は、Gemini 3.1上で動作する独立したサブエージェントを展開する。Agent(B)はAlphaProofへのクエリを追加し、Agent(D)はエルデシュ(Erdős)問題に使用された。
研究者たちは、シンプルなエージェントの成功要因として、高速な反復処理と形式的推論の組み合わせを挙げている。
システムの成果は、数学証明ライブラリ「Mathlib」が成熟している組合せ論、凸最適化、整数論などの分野に集中している。
完全な証明が得られない場合でも価値があると研究者らは述べている。証明スケッチが形式的なものであるため、専門家は論証全体を最初から検証し直す代わりに、未解決のサブゴールに集中できる。エージェントは部分的な進捗も残している。
このシステムはすでに量子光学とグラフ理論に関する進行中の研究で活用されており、すべてのLeanコードは公開されているという。
OpenAIも最近、類似のアプローチを用いてエルデシュ問題に取り組んでいる。一部の観点ではそちらの結果の方が注目度が高い面もある。
ただし、テレンス・タオ(Terence Tao)はかねてより、エルデシュ問題におけるAIの実際の成功率について、見出しから過大に読み取ることに警鐘を鳴らしている。
