>_tech-draft
Mastra AIのアイコン
Mastra AI
動画公開日
タイトル

Does MCP Suck? TSAI Conf Recap, Ismail from Superagent

再生時間

1時間 37分 11秒

AIエージェント開発の最前線:MCPの課題、認証、TypeScript AI Conferenceの洞察

ポイント

  • AIエージェント開発者は、Multi-agent Communication Protocol (MCP) の現状と、特に認証が普及の最大の障壁となっている理由を理解できます。
  • 本記事はMCPがツール連携の標準化に貢献した背景を解説し、言語固有のツールとの比較やstdio/HTTP実行環境の課題を深掘りします。
  • TypeScript AI Conferenceの洞察を交え、AIエージェント開発における技術コミュニティの模索と、今後の最適なソリューションの方向性が示唆されます。

AIエージェント開発の最前線:MCPの課題、認証、TypeScript AI Conferenceの洞察

皆さん、こんにちは!「AI Agents Hour」へようこそ。この番組では、AIエージェントの世界における最新の動向やホットな話題をお届けしています。今回は、先週開催されたTypeScript AI Conferenceの様子を詳しくご紹介するとともに、AIエージェント開発で注目されている「MCP」(Multi-agent Communication Protocol)の現状と課題に深く切り込みます。「MCPは本当に使い物にならないのか?」という疑問に、様々な角度から迫ります。さらに、AI業界の最新ニュース、そしてSuper Agentのイスマイル氏をお迎えし、彼らが実施したクールな調査結果やベンチマークについてもご紹介します。

先週の振り返り:サンフランシスコでのライブ配信

先週の「AI Agents Hour」は、サンフランシスコのバーからライブ配信するという、いつもとは異なる趣向でお届けしました。サンフランシスコに到着後、そのままバーに直行し、ライブストリームを実施したのですが、これは私たちがこれまで行った中で最も記憶に残る配信の一つでした。ビールを片手にゲストを迎え、さらに番組終了15分後には、私たちがいるバーを聞きつけて駆けつけてくれた視聴者の方とのサプライズな出会いもありました。この出会いは、その後のTypeScript AI Conferenceでも再会を果たすことができ、大変クールな体験となりました。

また、ライブ配信の拠点として利用させていただいた「Victory Hall」というバーは、カンファレンス期間中、多くの人が集まり、食事やドリンクを楽しむワーキングスペースとしても大活躍しました。私たちは全く計画していなかったのですが、結果的にバーの奥の部屋をコワーキングスペースとして活用し、食事や飲み物を注文することで場所を提供してもらいました。チームのメンバーがよく食べ、よく飲むおかげで、彼らも喜んでくれたようです。将来的には、より公式なスタジオルームを設け、皆で集まって番組を収録できる場所を作る計画を進めています。

MCP(Multi-agent Communication Protocol)は本当に「ダメ」なのか?

AI業界の動向は常にドラマティックですが、X(旧Twitter)では現在、「MCPが本当に使い物にならないのか?」という議論が巻き起こっています。私たちはこのドラマを掘り下げ、MCPの現状と課題について深掘りしていきます。

MCP誕生の背景と課題

MCPの起源を辿ると、1年以上前、AIエージェント開発が始まった当初にはMCPという概念は存在しませんでした。当時は、各プログラミング言語に特化したツール(言語固有のツール)を作成するのが一般的でした。

JavaScriptコミュニティでは、Node.jsのSDKが豊富に用意されていたため、ツール呼び出し(tool calls)の実装はそれほど大きな問題ではありませんでした。しかし、すべてのコミュニティがJavaScriptのように恵まれているわけではありません。例えばPythonの世界では、ツール連携の環境がまだ十分に整備されていない状況でした。

言語固有のツールを統合する際の最大の問題は、異なるモジュール間で標準的なプロトコルが存在しないことでした。StripeのクライアントSDKを使用する場合でも、別の開発者が作成したSDKとは仕様が異なる可能性があり、それぞれのツールの品質やドキュメントの一貫性も保証されないという課題がありました。

ツール連携の標準化とMCPの普及

そんな状況の中、MCPが登場しました。当初、主にツール呼び出しのユースケースを解決するために開発されたMCPは、多くの開発者に歓迎されました。その最大の利点は、言語に依存しないエージェント固有のツールを作成できるようになったことです。

各ツールはスキーマを持ち、任意の言語で実装できるようになったことで、ツール連携の標準化が進み、開発コミュニティで急速に普及しました。これにより、個々のプロジェクトやフレームワークでツール問題を解決しようとしていた人々にとって、大きな一歩となりました。

機能拡張と最大の問題:認証(Auth)

MCPはその後、ツール呼び出しだけでなく、リソース(Resources)、プロンプト(Prompts)、エリシテーション(Elicitation)、進捗報告(Progress)など、多くの機能が追加され、その仕様は拡張されてきました。

しかし、この間、MCPに関して常に最大の疑問として存在していたのが「認証(Authentication)」の仕組みです。AIエージェントがサードパーティのツールと連携する場合、当然ながら認証が必要となります。この認証メカニズムの仕様策定と実装が非常に難航しており、この点がMCPの普及における最大の障壁となっています。

標準仕様の策定に時間がかかりすぎると、開発者たちはすでに自分たちの言語固有のツールで問題解決の方法を知っているため、そちらに戻ってしまう傾向があります。現在Xで議論を巻き起こしているツイートの多くは、まさに言語固有のツール開発に深く関わっている人々からのものであり、この認証の問題が現状を反映していると言えるでしょう。

stdio vs. HTTP: ツール実行環境の議論

チャットからは「本番環境でHTTPではなくstdio(標準入出力)トランスポートを使用できるか?」という質問がありました。

stdioの可能性

理論的には、本番環境でstdioを使用することは可能です。例えば、クラウドデスクトップのような環境で利用することを想定しているのであれば、動作させることができます。実際、MRA MCPのドキュメントサーバーではstdioを使用しています。

また、stdioを使用すると、ファイルシステム全体にアクセスできるという大きな利点もあります。

stdioの課題

しかし、stdioを本番環境で利用することにはいくつかの課題があります。

  • サーバーレス環境での制約: stdioの場合、常にプロセスを起動しておく必要があるため、サーバーレス環境では利用できません。
  • ローカル環境への依存: ローカルにパッケージをダウンロードして実行するため、Node.jsのインストールが必須となります。
  • OS間の互換性問題: 過去にはWindows環境で問題が報告されることがありましたが、現在は改善されつつあるようです。しかし、OSに依存する特有の問題が発生するリスクはあります。

これらの問題を考慮すると、HTTPを使用する方がはるかに柔軟で、多くの一般的なクラウド環境に適していると言えるでしょう。

今後の展望

私たちは、今後「AI Agents Hour」をよりプロフェッショナルな形で提供できるよう、スタジオルームを設ける計画を進めています。より快適で質の高い環境から、AIエージェント開発の最新情報をお届けできるよう準備を進めてまいります。

まとめ

今回の議論を通じて、MCPがAIエージェント開発におけるツール連携の標準化に大きく貢献した一方で、特に認証メカニズムの課題が、その広範な普及における障壁となっていることが明らかになりました。

技術コミュニティは、常に最適なソリューションを模索しており、言語固有のツールとMCPのような標準プロトコルの間で、それぞれの利点を活かしながら進化していくことでしょう。TypeScript AI Conferenceで得られた学びや、Super Agentによる具体的なベンチマークは、今後のAIエージェント開発の方向性を示す重要な洞察を提供してくれるはずです。

参考動画

AI Agents Hour: Does MCP suck? Typescript AI Conference recap & Super Agent - Ep 70