Compliance, Reliability, Observability: David Cusatis on Scaling Agents at Range
17分 35秒
MRAを活用したAIエージェント本番運用:Rangeの挑戦と解決策
この記事は動画の内容を元にAIが生成したものです。正確な情報は元の動画をご確認ください。
ポイント
- •AIエージェント開発フレームワークMRAを活用し、金融プロダクトRangeが本番運用で直面した課題とその解決策を紹介します。
- •SEC規制遵守、システム信頼性、応答速度、可観測性を実現するための具体的なアプローチを解説。
- •AIエージェントを実用化し、安定運用を目指す組織にとって、貴重な実践的知見が得られるでしょう。
AI技術の進化は、金融業界に変革をもたらし、AIエージェントは顧客体験と業務効率を向上させる可能性を秘めています。本記事では、AI搭載の資産管理プロダクト「Range」が、AIエージェント開発フレームワーク「MRA」を活用し、本番環境での運用において直面した課題と解決策をご紹介します。Rangeは、投資、税金、キャッシュフロー、退職金計画といった金融アドバイザーサービスをAI駆動型プロダクトとして提供し、従来の対面アドバイザーより低コストです。私たちは過去1年以上にわたりMRA上で多くのAIエージェントを構築し、高い信頼性とパフォーマンスを実現する経験と知見を得てきました。
RangeにおけるAIエージェントの活用事例
Rangeでは、多岐にわたる金融サービスでAIエージェントを活用しています。特に重要なのが、フラッグシップAIエージェント「Ry(ライ)」です。
フラッグシップAIエージェント「Ry」
Ryは、長年人間アドバイザー向けに構築した技術を活用し、高品質な金融アドバイスを提供します。独自の投資哲学でトレーニングされ、金融アドバイス関連の認定試験で人間アドバイザー平均70%に対し、Ryは常に優れた成績でパスできます。
ユーザーはRyに「2026年の税務計画作成」といった質問をします。Ryは、内部構築の税務予測システムを利用して税務予測を実行。このシステムには全50州および連邦の税法がコード化され、ユーザー状況に応じた正確なアドバイスを生成可能です。
その他のAIエージェント
Ry以外にも、以下のAIエージェントを運用しています。
- オンボーディングエージェント: 従来の書類提出プロセスを効率化するため、ドキュメント解析ワークフローを統合したエージェントを開発しました。
- 社内金融アドバイザー支援エージェント: 社内アドバイザーの業務効率を向上させ、サービス品質を高めます。
- サポート診断エージェント: カスタマーサポートスタッフを支援し、迅速かつ正確な問題解決を可能にします。
本番環境でAIエージェントをスケールさせるための主要な焦点
AIエージェントを本番環境で大規模運用するにあたり、Rangeは以下の3つの領域に注力しました。
1. 監査可能性とコンプライアンス
RangeはSEC(米国証券取引委員会)登録の投資アドバイザーであり、データ保持などのSEC規制を厳守する必要があります。そのため、ログの監査可能性に重点を置きました。具体的には、すべてのLLM(大規模言語モデル)ツールコールにおけるメタデータと「思考トレース」を詳細にキャプチャし、規制準拠と動作履歴の追跡を可能にしています。
2. 信頼性
金融トピックを扱うAIエージェントにとって信頼性は最重要です。システム停止や期待外れの動作は、ユーザー体験を著しく低下させます。私たちはフェイルオーバー戦略とレジリエンス(回復力)の確保に多くの時間を費やし、障害発生時にもサービスが継続できるよう対策を講じています。
3. 速度と低レイテンシー
「スピードは超能力」という考えのもと、最先端のインテリジェンスと高品質な金融アドバイスを、非常に低いレイテンシーで提供することを目指しました。リアルタイムで的確なアドバイスを得られるよう、応答速度の最適化は重要な側面です。
4. 可観測性(Observability)
信頼性とコンプライアンスの確保には可観測性が不可欠です。様々なステップやサブエージェント実行におけるトレースは、エージェントの複雑な動作、特にネストされた実行の中で何が起こっているかを把握するために重要です。可観測性がなければ、エージェントの性能を理解し改善することは困難です。
ワークフローとエージェントの適切な選択
MRAフレームワーク初期には「ワークフロー」と「エージェント」という2つの選択肢がありました。レイテンシーなどの理由から、Rangeではワークフローを多用。重要なのは、タスクに適切な抽象化を選択することです。
ワークフローの活用
ワークフローは、文書解析のような明確なステップを持つタスクに適しています。Rangeでは、以下の4段階プロセスで文書解析を行っています。
- 前処理: 解析可能な形式への変換。
- 分類: 文書の種類を識別。
- 情報抽出: 必要な情報を抽出。
- 検証: 抽出情報の正確性を確認。 このような定型化された処理にはワークフローが有効です。
エージェントの活用
一方、エージェントは、タスクがオープンエンドで、超低レイテンシーが必須ではないアプリケーションに適しています。最新のLLMは、豊富なツールセットが与えられると非常に高いパフォーマンスを発揮します。Rangeでは、AI構築以前に人間アドバイザー向けに開発した多くのツールをAIエージェントに接続し、高い成功を収めています。
実装における具体的なアプローチ
MRAおよびAI SDKは実行ライフサイクルの様々な側面に対して優れたフックを提供しており、これらを活用して可観測性を強化しました。
- 詳細なロギング: サブエージェント実行、各ステップの開始・完了、ツールコールの開始・停止など、エージェント動作に関するイベントを詳細に記録。
- パフォーマンスメトリクス: レイテンシー、成功/失敗率、トークン使用量など、エージェントのパフォーマンスに関するメトリクスを収集。
- アーカイブ: コンプライアンス要件を満たすためのデータアーカイブ仕組みを構築。 これらのデータは、エージェントの動作理解、問題診断、性能改善に役立ちます。私たちは独自のトレースシステムを構築しましたが、MRAもStudioでメトリクスとロギング機能を提供しています。
レジリエントな言語モデルの構築
多くのクラウドプロバイダーは容量制約に直面し、一時的な障害が発生することがあります。このようなプロバイダー側の障害に対し、システムが回復力(レジリエント)を持つようにすることは重要です。そこで私たちは「レジリエント言語モデル」を構築しました。
このシステムにより、いくつかの方法でフェイルオーバーを実行できます。
- APIプロバイダー間のフェイルオーバー: 例:Anthropic APIからAmazon Bedrockへ、または特定のモデル(Cloud Opus 46)から別のモデル(Gemini 3.1 Pro)へ切り替えることが可能です。
この経験から、「Bedrockにフェイルオーバーすれば良い」という安易な考えは危険だと学びました。多くのユーザーが同様にフェイルオーバーを試みるため、Bedrock側でカスケード的な障害が発生する可能性があります。したがって、フェイルオーバーの方法を自身で細かく制御し、モデルが真にレジリエントであることを確認することが重要です。
まとめ
RangeがMRAを活用してAIエージェントを本番環境で成功させるまでの道のりは、コンプライアンス、信頼性、速度、可観測性といった多岐にわたる課題への取り組みでした。適切な抽象化の選択、詳細な可観測性メカニズムの構築、そしてレジリエントな言語モデル戦略は、AIエージェントを実用的なプロダクトとして運用するために不可欠です。
これらの知見は、今後AIエージェントを開発し、本番環境で運用しようとするすべての組織にとって、貴重な羅針盤となるでしょう。
参考動画: https://www.youtube.com/watch?v=5eoGrvoLG1Q