中島聡が考える、「大昔の人々はAPIを叩いて暮らしてたんじゃよ…」な時代は近い?
2024.12.26
by 中島聡
対話型AIの「Claude」で知られる米国の人工知能スタートアップ企業、Anthropic(アンソロピック)。
同社が発表したオープンソースのプロトコル「MCP(Model Context Protocol)」が最近、大きな注目を集めています。
もちろん著名エンジニアの中島聡氏も興味津々なのですが、一体何がそんなにすごいのでしょうか。そして、中島氏が考える「MCPの一歩先にあるもの」とは?
アンソロピック社のMCP(Model Context Protocol)が注目される理由
少し前から、Anthropicが発表したMCP(Model Context Protocol)の持つポテンシャルについて書いてきました。
MCPは、AI(具体的には、マルチモーダルなLLM)がデータベースからデータを取り出したり、APIを使って何らかの処理をする際のプロトコルを標準化しようという試みです。別の言い方をすれば、多くのLLMがすでにサポートしている”function call”の仕組みを拡張し、アプリケーションが設計された段階では知られていなかったAPIをLLMが”function call”を使って呼び出せるようにする仕組みです。
APIを提供するMCPサーバーは、そのAPIがどんな役割を果たし、どんなパラメータを期待しているのかをメタデータとして提供し、LLMはそれを見て、どのAPIを呼ぶべきかを判断するのです。MCPの仕組みをオープンな形でAnthropicがスタートしたことを私は高く評価しており、これが業界標準となることを切に願っています。
近い将来、MCPすら「時代遅れ」になる可能性も
しかし、LLMの進化のベクトルを考えると、MCPですら時代遅れになる可能性が十分にあるところが、今の時代の面白さです。
上に書いたように、MCPサーバーは、自分が提供するサービスの内容を構造化されたメタデータの形で提供し、クライアントであるLLMはそれを見た上で、構造化されたfunction callを使ってMCPサーバーにアクセスしますが、自然言語を理解するLLMを両側に置けば、「構造化されたメタデータ」や「構造化されたfunction call」をプロトコルから完全に排除することすら可能だと私は思うのです。
例えば、(Anthropicがサンプルコードを提供しているような)天気予報を行うサービスがあった場合、そのサービスの上にLLMを置くことにより、クライアントとサーバー間のプロトコルすら自然言語で行うことが可能になるのです。
つまり、ユーザーから「明日の東京の天気は?」と尋ねられた(フロントエンド側の)LLMは、登録されているサーバーの中から「世界各地の天気予報をするサービスです」と自然言語でサービスの内容を宣言している「天気予報サーバー」を選び、それに対して(function callではなく)「明日の東京の天気は?」と自然言語で話しかけるのです。
すると天気予報サーバー側のLLMが(内部ではMCP/function callのような仕組みを使って)東京の天気を調べた上で、「明日の東京は、晴れのち曇り、最低気温は摂氏17度、最高気温は23度」のように自然言語で答えます。
別の言い方をすれば、「自然言語を理解するLLM」を走らせるコストが限りなくゼロに近づいた将来においては、サーバーとクライアント、もしくは、サーバー同士のコミュニケーションすら自然言語で行うことが可能になり、パラメータを正確な順番で指定しなければならない、構造化されたAPIは不要になるのでは、と考えているのです――
※ メール・BLOG の転送厳禁です!!
よろしくお願いします。
コメントをお書きください