最新AIモデル o1モデルとは

OpenAI o1とは？
OpenAI o1の特徴
効率に優れた「OpenAI o1-mini」
まとめ

OpenAI o1とは？

ChatGPTで有名なOpenAI社が2024年9月12日に最新のLLM（大規模言語モデル）を公開しました。それが、「OpenAI o1」です。

今までの4oモデルと比較してo1モデルが進化した部分は主に、複雑な問題解決能力や論理的思考力の向上です。特に、数学や科学、プログラミングなどの分野において、専門家レベルの性能を示しています。今回は、このo1モデルについて詳しく見ていきましょう。

OpenAI o1の特徴

ここではo1モデルの特徴として、3つ取り上げたいと思います。

人のような思考

o1モデルでは、Chain of Thoughtという考え方が採用されています。これは、AIモデルが答えを思いついたらすぐに回答を出力するのではなく、一度踏みとどまって本当にその答えで大丈夫なのか考え直してから出力されます。まさに人が物事を考えるようなプロセスに類似しています。

さらに、推論トークン（Reasoning tokens）を用いることで、プロンプト（人間からの指示）に対する理解を分解し、応答を生成するための複数のアプローチを検討することができています。

以上のプロセスを経ることで、o1モデルはかなりの高精度なモデルに進化することができました。

https://platform.openai.com/docs/guides/reasoning

精度（問題解決能力の高さ）

続いて、先ほどの思考過程を経ることでどれくらい精度や問題解決ができるのか見ていきましょう。下のグラフは、さまざまなモデルにおける左：数学オリンピック予選、中央：競技プログラミング、右：博士レベルの問題に対する結果となります。今まで精度が高いと言われていたgpt4oモデルに対しても圧倒的な精度の差を見せつけています。

https://openai.com/index/learning-to-reason-with-llms/

ちなみに、このo1モデルの結果はそれぞれの問題に対して、人間と勝負してもかなりいい戦いをすることが考えられます。

数学オリンピック：アメリカの学生の上位500名に入る数学力
競技プログラミング：参加者の上位約10%
博士レベルの問題：博士課程学生を超える科学の知識量

回答の安全性

最後の特徴として、安全性についても触れておきましょう。人間がAIを意図的に暴走させたり、中身の情報を取得しようとするJailbreaksという安全性を示す評価方法があります。

その結果が下の通りです。GPT-4oと比較すると、特にStrongRejectの項目では差は明らかで、安全性は格段に良くなったということができます。

https://assets.ctfassets.net/kftzwdyauwt9/67qJD51Aur3eIc96iOfeOP/71551c3d223cd97e591aa89567306912/o1_system_card.pdf

効率に優れた「OpenAI o1-mini」

o1-miniモデルについても紹介しておきましょう。名前の通り、o1モデルの小さい版という位置づけなのですが、このモデルが特にすごいです。また、ここでいう小さいとは、AIモデルの特徴量が少ない、結果的にコストが小さくなるといった意味になります。

miniというだけあって、o1モデルよりもプロットが左側（コストが小さい）にあります。ここで、普通であれば精度が下がるのではないかと思うのですが、o1-miniモデルは、精度に関してもo1モデルと同等という結果になっています。

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

まとめ

OpenAI o1は、従来のGPT-4oと比較して大幅な進化を遂げた最新の大規模言語モデルです。o1モデルは、人間のような思考プロセスを模倣し、高度な問題解決能力や推論能力を持つ点が特徴です。数学やプログラミング、博士レベルの科学的知識においても、人間の専門家に匹敵する高い精度を示しています。また、安全性においても大幅な向上が見られ、意図的な操作や情報漏洩への対応も強化されています。

さらに、コスト面で効率を追求した「o1-mini」もリリースされ、軽量ながらも精度を維持するモデルとして注目されています。o1シリーズは、性能と安全性、そして効率性の三拍子が揃ったモデルとして、幅広い分野での活用が期待されています。