OpenAI GPT-5、初日は賛否両論
2025-08-09 10:25

オープンエイの最高経営責任者サム・アルトマンは、数ヶ月前からGPT-5を予告していた。より賢く、より速く、"博士レベル "の思考が可能な先進的なモデルだと彼は主張した。同社はこの発表を、ChatGPTの大きな前進、つまりコーディング、推論、精度の知能向上につながるものだと位置づけた。しかし、初期の反応はもっと泥臭いものだった。開発者たちは、このモデルが複雑なプロンプトを理解し、よく構造化されたコードを出力することを賞賛した。初期のテスターであるサイモン・ウィリソンは、GPT-5を「有能」で「時折印象的」だが、GPT-4からの大きな飛躍はないと評した。しかし、GPT-4からの大きな飛躍はなかった。ソーシャルメディア上のいくつかの投稿はすぐに、多くの事実誤認、脆弱な数学スキル、そしていくつかのケースでは基本的なスペルミスに対する不満に変わった。ベントレー大学の数学教授であるノア・ジャンシラクサは、このリリースを「圧倒的」と呼び、問題のアップデートは「私が期待していたよりもわずかなものだった」と指摘した。混乱の一因は、モデルのアーキテクチャにあった。GPT-5には、そのタスクに応じて、様々なモデルサイズ用の『オートスイッチャー』が含まれることになる。これは処理の手間を省き、常にGPT-5をフルに使っているわけではないことを意味する。このシステムで質問に不正解すると、一緒に作業していたエージェントは、ブルーベリーの "b "の文字がいくつあるか「もっとよく考える」ように指示した。そのフィードバックの後、照会されると正しい答えが返ってきた。ユーザーは反発し、OpenAIはそれに応えた。その不満は金曜日までにRedditやXに波及した。そのテキストが誰のものなのか、あるいはどのモデルのものなのかさえわからないという事実を嫌うユーザーもいたが、多くのユーザーは、地獄は単なる推論であり、GPT5は彼らが信頼している古いお気に入りに取って代わったのだと感じていた。何人かは、品質が影響を受け、ライティングはGPT-4.5ほど良くないと言った。このチャットをきっかけに、OpenAIのCEOはRedditの「Ask Me Anything」に参加し、反発に対処することになった。彼は、自動スイッチャーのバグにより、GPT-5は初日からその潜在能力をフルに発揮できなかったと述べた。彼は今後のモデル移行において、より透明性を高めることを約束した:今日からGPT-5はますますスマートに見えるはずだ」。OpenAIはまた、GPT-4oのような以前のモデルを、好みを表明した人々のために再展開することも約束した。このように迅速に行動する必要があったことは、いかに大きな賭けであったかを浮き彫りにしている。今日、OpenAIは、Anthropic、Google DeepMind、さらにはイーロン・マスクのxAIといった競合他社と猛烈な競争を繰り広げている。これだけの競争があれば、ちょっとした手違いで、すぐにライバルが一歩先を行くことになる。AIレースで激化する競争 このような違いがあっても、GPT-5の評判は生ぬるかったが、それでもLMArena(ユーザー主導のトレーニングモデルのリーダーボード)でトップに躍り出るのを止めることはできなかった。GPT-5は、今日我々がプログラマブルとみなすようなものではなかったが、非常に高速で表現力があり、大規模で複雑なクエリーをサポートしていた。しかし、他のベンチマークでは、異なる、より困難な問題状況が示された。マスク氏のxAIのGrok 4は、ARC-AGI-2(高度な推論のための一連のテスト)で非常に高いスコアを獲得し、OpenAIの優位性に大きな挑戦を示した。業界アナリストの中には、GPT-5の効果が完全に理解されるまでには、GPT-3のような同社による過去のブレークスルーと同様に、少なくとも1日はかかるだろうと推測する者もいる。GPT-5とGPT-4は、アップデートや他のユースケースで改善が見られる前に、大きな反発を受けた。このモデルは、人々の日常的なワークフローにどれだけ役立つかによって成功する(あるいは失敗する)可能性を秘めており、世界中には毎週7億人近くのChatGPTユーザーがいる。ウォートン校のイーサン・モリック教授の言葉を借りれば、こうだ:「GPT-5は、時には驚くようなことを、時には不可解なことを、完全に独力でやってのけます。それこそが、GPT-5を非常に魅力的なものにしている。公衆衛生分野のこのような部分を「興味深い」と呼ぶのは、まだ技術主義的で少し不気味なアプローチだ。理解しよう。ニュースレターを購読してください。無料です。
https://www.cryptopolitan.com/openai-gpt-5-draws-mixed-reviews-on-day-one/