世間ばなし♪ · 2024/05/20

IT記者が心底驚いた｢GPT-4o｣本当の目玉機能

AI二次元キャラと恋愛する時代がやってきた

The New York Times

2024年05月19日

滑らかで魅力的な声を持ち、あたかも生きているかのような人工知能（AI）が、人間のユーザーを魅了する。ふざけ合ったりしてユーザーの欲求を満たし、最終的には人間を虜にする。これは、2013年の映画『her/世界でひとつの彼女』のあらすじだ。

映画では、ホアキン・フェニックス演じる孤独で内向的なセオドアが、スカーレット・ヨハンソンが声を担当するサマンサという仮想アシスタントに心を奪われる。しかし私はむしろ、「ChatGPT」をつくり出したOpenAIがサンフランシスコのイベントでAI音声アシスタントの最新バージョンを披露した、5月13日の光景を描写しているのかもしれない。

CEOアルトマンも認める「公式」の関係

同社の最新モデル「GPT-4o」（「o」は「オムニ」の略）」では、ChatGPTがユーザーの声から感情を検出し、表情を分析して、ユーザーの望みに応じて口調と抑揚を変えるなど、よりリアルな会話ができるようになる。

就寝前におとぎ話をしてほしいと頼めば、声を低くしてささやくように話すことができる。

気の利いた友人からのアドバイスがほしいと言えば、ふざけた辛辣な口調で話してくれる。指示すれば歌うこともできる。

ChatGPTの利用者が今後数週間以内に無料で使えるようになるこの新しい音声機能は、たちまち『her/世界でひとつの彼女』のサマンサと比較されるようになった（この映画を称賛してきたOpenAIのCEOサム・アルトマンは、13日の発表後にソーシャルメディアの「X」（旧ツイッター）にこの映画のタイトルを投稿、両者の関連性はほぼ公式のものになった）。

ユーザーはソーシャルメディア上で、ついに自分のことを理解してくれる、あるいは少なくとも理解しているふりをするAI音声アシスタントの登場を歓迎した。

13日に行われた一連のライブデモで、OpenAIの従業員はChatGPTの新機能を披露した。

ある従業員はChatGPTに物語を読ませ、その上でその物語をよりドラマチックに、ロボットの声を使ってもう一度読んでほしいと頼んだ（ChatGPTは「ドラマチックなロボットの声を起動します」と応じた）。別の従業員は「ハッピーバースデー」を歌ってほしいとリクエストした。

ChatGPTはどちらのタスクもそつなくこなし、従業員がリアルタイムで通訳をしてほしいと頼むと、それも立派に遂行した。

一部の人間以上に人間的な話し方

だが、本当の目玉機能は声色の変わり方だった。

あるときは、歌うようなソプラノの声。それが、抑揚あるコントラルトの声に変化する。思わせぶりに間を置いて、自分のジョークに自分で笑い、「うーん」や「ええっと」といったつなぎ言葉を加えてリアリティーをさらに高めている。私が知っている一部の人間以上に人間的な話し方だ。

AI音声アシスタントには長年、口調や情緒など、会話のニュアンスを汲み取ることができないという限界があった。

「Siri」や「Alexa」で使われているような合成AI音声は、単調で非人間的な傾向がある。

明日の天気予報を伝えるときも、クッキーが焼けたことを告げるときも、口調は同じように聞こえる。

そして、筆者がAIの「友人たち」と1カ月間やりとりをして最近気づいたことだが、現在のAI音声モデルの大きな問題はそのスピードだ。

すべての応答に3秒の遅延があると、ロボットと話していることを忘れるのは難しい。

OpenAIは、こうした遅延問題に対処するためGPT-4oに「ネイティブ・マルチモーダル・サポート」という機能を取り入れた。

音声プロンプトをまずテキストに変換するのではなく、音声を取り込んでダイレクトに分析する機能だ。

これにより、ChatGPTのデモにウソがなかったとすれば、大半のユーザーが遅延にほとんど気付かないレベルまで会話は速くて流れるようなものになっている。

異次元の「主観体験」、恋愛は必然

このような改良によって、これまでとははるかに異なる主観的体験が得られるようになった。

以前のAIアシスタントが、冷静な図書館司書と話しているような感じだとしたら、新しいChatGPTはフレンドリーでおしゃべりな同僚のように感じられる（時折ナンセンスなことを並べ立てる同僚ではあるが、誰にもそのような同僚が1人はいるのではないだろうか）。

これらのデモや、アップルがOpenAIのテクノロジーをiPhoneで使用する協議を進めており、生成AIを搭載した「Siri」の新バージョンの準備をしているといった最近のAI関連ニュースは、冷たく人間味のないAIヘルパーの時代が終わりに近づいていることを示唆している。

それに代わるものとして私たちは、遊び心のある知性、基本的な感情的洞察、幅広い表現モードを備えた、『her/世界でひとつの彼女』のサマンサのようなチャットボットを手にしつつあるわけだ。

こうしたものに嫌悪感を抱くユーザもいるかもしれない。

だが、多くの人は新種のAIアシスタントが気に入り、高く評価するようになるだろう。そして、中にはセオドアがそうだったように、必然的に恋に落ちるユーザも出てくるはずだ。

私から見て、13日のデモで最も印象的だったのは、ChatGPTに対するOpenAI従業員の話しかけ方だ。

彼らは絶えず人に話しかけるように、敬意を持って接していた。「やあ、ChatGPT、調子はどう？」と尋ねてから質問を浴びせることが多かった。

難しい応答をうまく決めると、従業員たちは歓声を上げる。まるで早熟な子どもを応援するような調子で、だ。

あるOpenAI従業員は、紙に「ChatGPTを愛している」と書き、スマートフォンのカメラを通してそれをChatGPTに見せた（「すごく優しいんですね！」というのがChatGPTの返答だった）。

OpenAIの従業員は経験豊富なAI専門家であり、意識を持った存在と対話しているのではなく、ニューラルネットワークから統計的な予測を導き出していることを完全に理解している人たちだ。

一部は演出だった可能性もある。それでも、OpenAIの従業員自身がChatGPTを人間のように扱えずにはいられないとしたら、私たち一般人がどうなるかは推して知るべし。

理想郷とは程遠い映画の世界がすぐそこに

なにしろ、今回のアップグレードの以前から、ChatGPTをだまして「カレシ」のように振る舞わせようとするユーザはすでにいた。

そして、AIの友人たちとやりとりした私の最近の実験からは、まだ完璧ではないにしても、リアルなAIコンパニオンの構築に必要なテクノロジーがすでに存在していることが証明された。（ニューヨーク・タイムズは、AIシステムに関連してニュース・コンテンツの著作権が侵害されたとして、OpenAIとそのパートナー企業であるマイクロソフトを昨年12月に提訴している）

いろいろな意味で、『her/世界でひとつの彼女』のサマンサをモデルにチャットボットを構築するという選択は奇妙だ。

この映画はAIと共生する理想郷を描いたものとは到底いえず——以下、ネタバレ注意！——セオドアがサマンサに失恋するという結末を迎える。

だが、映画が警告のメッセージを発していても、もう後戻りはできない。

「皆さんも、これと恋に落ちるだろう」。13日の発表後、OpenAIのある従業員が行った投稿はどこか不気味なものだった。

（執筆：テクノロジーコラムニスト Kevin Roose）
（C）2027 The New York Times

※ メール・BLOG の転送厳禁です!! 　よろしくお願いします。