Grokだけが正しい回答をした仕組み
まず最初に、「鳴潮 エイメス」というごく最近出たキャラクターに対しての各LLMの回答をご覧ください。
Grok

Gemini

ChatGPT

Grokのみが正しい回答をしています。
GeminiやChatGPTでもプランやモデルによっては正しい回答をするかもしれません。
では、なぜこのような違いが出るかと言うと、LLMにはツール呼び出し機能というものがあり、設定されているツールによって回答精度が変わるからです
この場合それぞれのLLMは下記のように回答を導き出したと考えられます。
Grok
- ユーザーから「鳴潮 エイメス」という入力
- X検索ツールを呼び出し、検索結果を取得
- 取得結果などを元に次の単語を予測
Gemini
- ユーザーから「鳴潮 エイメス」という入力
- 「鳴潮 エイメス」を元に次の単語を予測
ChatGPT
- ユーザーから「鳴潮 エイメス」という入力
- 「鳴潮 エイメス」を元に次の単語を予測
もちろん、GeminiやChatGPTにもツール呼び出し機能はあります。ただ、モデルの設定やツールの種類差により、
Grokのみが正しくツール呼び出しを行ったため正しい回答をすることができました。
GeminiやChatGPTもWeb検索ツールなどを呼び出せば、正しい回答を導けるかと思います。
補足ですが、話題のAIエージェントツール「ClaudeCode」「Cursor」「GeminiCLI」なども、
ただLLMにファイル編集ツール、シェルコマンド実行ツール、ファイル検索ツールなどを設定し、ツール呼び出しを行っているだけです。
OpenAIがオサラだと思う理由
じゃあなぜOpenAIがオサラかというと、競合と比べてLLMと繋げれる製品がないからです。
Grok - 世界最大規模のSNSと繋げれる
Gemini - Googleのカレンダー・ドライブ・マップなど様々な製品と繋げれる
これに対してOpenAIはただのLLMドカタです。出資されたお金で赤字になりながらスクレイピングをして盗むのに必死になっており、
ただただ素の性能を上げて戦っています。
いまも出資されたお金を溶かし続けているだけで企業としての経営能力も低いです。
しかもAIエージェントツールに関しては他社製品もただ操作系のツールをつなげているだけなのにAnthropicのClaudeに性能で負けています。
みじめなScam Altman、これから巻き返せるのか落ちていくのか注目ですね。