AIエージェントは、見栄えのいいデモの段階を脱し、ついに実際の本番業務フローに移行しつつあります。 AWS AgentCoreにより、チケットの発行、API の呼び出し、インフラストラクチャのデプロイ、外部ツールの呼び出し、および変更を行うエージェントを、人間のオペレータよりも迅速に構築できます。

これは強力ですが、全く新しい運用とセキュリティ管理の課題ももたらします。そしてここに不都合な真実があります。ほとんどの組織は、エージェントが実際に何をしているのか把握していないのです。

エージェントAIは、魔法ではありません。KubernetesやLambda、その他の重要なサービスに期待されるのと同等の可視性が必要な、特権的な自動化レイヤーです。ログを抽出しないと、把握不能になります。

これが、 Sumo Logic Amazon Bedrock AgentCore App を構築した理由です。ダッシュボードのためのダッシュボード追加ではなく、エージェント型ワークフローを安全かつ予測可能に実行するために必要な可視性をチームに提供するためです。このアプリはより大きなものの青写真となる：効果的なAIロギングの在るべき姿を示しています。

このブログは製品のチュートリアルではありません。これはなぜAIロギングが重要なのか、そしてAgentCoreがいかに道筋を示すかを提示する実践的に説明しました。

AIエージェントは現代の特権サービスアカウントです

自律的に意思決定する以外は。

AgentCoreエージェントはスタック全般にわたりアクションをトリガー可能です。例えばクラウドリソース生成、SaaS連携、コード稼働、データ収集、システム更新を、指示と状況のみに依存して遂行できます。もしインターンがこのレベルのアクセス権を持ちながら、その行動を記録していなかったら、5分以内でシャットダウンするでしょう。AIエージェントがそのような問題を起こしても、多くのチームは「AIがAIであるだけだ」と受け流します。

それは持続可能ではありません。エージェントが本番環境に影響を与えうる場合、そのエージェントがかかわる全要素の完全な可視化が必要です。

すべてのAIシステムで監視の必要がある5つのログカテゴリ

以下は、すべてのAIシステムで監視すべき5つのログカテゴリーです。AgentCoreはCloudWatchとCloudTrailを通じネイティブに公開し、Sumo Logicアプリはそれらを可視化します。しかしこれらのカテゴリーは、どのようなエージェント型AIプラットフォームにも当てはまります。

ランタイムログ：エージェントが実際に行ったこと

これには、実行トレース、操作、エラー、再試行、出力、およびステップ単位の活動が含まれます。これがインシデントのタイムラインであり、監査証跡です。障害発生時、これらのログが「この事態に至る直前の瞬間に、エージェントは何を実行したか？」という問いに答えます。

ゲートウェイのログ：エージェントが接触した外部システム

エージェント型AIの「危険」領域の大半は、外部APIやサービスとの連携を伴います。ゲートウェイログは、どの呼び出しが、どこで、どのような結果で行われたかを正確に示します。ここで設定ミスや反復的な障害を発見できます。

メモリログ：エージェントが保存または取得したデータ

メモリは、基本的にモデルによって制御される動的な知識ベースです。書き込み、読み込み、更新は常にログに記録し、エージェントがどのようにコンテキストを発展させているかを追跡できるようにすべきです。

内蔵ツール (ブラウザとコードインタプリタ)

これらはリスクの高い領域です。エージェントが URL 訪問、コード実行、スクリプト実行を行う場合、その全動作をログに記録する必要があります。これらのツール用の Sumo Logic ダッシュボードにより、従来のセキュリティ制御を簡単にすり抜ける可能性のある操作を可視化できます。

CloudTrail によるアイデンティティとアクセスログ

これで、誰がエージェントを起動したか、誰が設定を変更したか、誰が新しいツールを追加したか、誰が権限を変更したかを追跡できます。ガバナンスとコンプライアンスの基盤となるのがこの仕組みです。

Sumo Logic AgentCoreアプリから学ぶこと

このアプリは、エージェントシステムの監視における最も重要な点について、独自の見解を提供します。

概要ダッシュボード: 呼び出しパターン、エラー率、レイテンシ分布、トップエージェントとツールを表示します。ここで、挙動の変化や不安定さの初期兆候を発見することができます。

ランタイムダッシュボード: ここでは、APM トレースと同様に、各エージェント実行のステップレベルの活動を確認できます。エージェントがどのように推論しタスクを進め、どこで障害が発生するかを理解するのに役立ちます。

ゲートウェイダッシュボード：外部APIの使用と統合動作を表示します。これは、エージェントが他環境とどのように相互作用するかを理解するために重要です。

内蔵ツールダッシュボード: ブラウザとコード実行アクティビティを追跡します。これらはあなたの「高リスクな自動化処理」監視ビューです。

アイデンティティダッシュボード: エージェントがどのように起動され、変更されているかを示します。これにより、チームは不正な変更や不審な呼び出しパターンを検出できます。

AgentCoreを使用していなくても、これらのダッシュボード設計は、AIプラットフォームの監視機能に必要な基本条件を示しています。

なぜAIのログが重要なのか

エージェントAIは物事を破綻させます。指示を誤解します。人間のオペレーターなら考え直すような行動を、高い確信度で実行してしまいます。それが自律システムの現実です。

問題は、エージェントが時々ミスを犯すことではありません。問題は、誰も監視していない環境でミスを犯すことです。

ロギングは、自律的に動作するシステムにおいて、安全装置の確立、インシデントの説明、誤用の検出、ガバナンス実施、動作変化の追跡、挙動の調整、そして運用上の信頼維持を可能にする手段です。

ログのないAIは手に負えません。ログを持つAIは技術スタックの一部に過ぎません。

チームが今すべきこと

適切な観測体制を構築し始めるのに、大規模なAI配備は必要ありません。以下の手順で、AIシステムの監視を開始してください。

ランタイム、ゲートウェイ、メモリ、組み込みツール、および ID イベントのロギングをオンにします。
Sumo Logicで一元管理すると、散在するロググループ間での相関分析の手間が省けます。
ベースライン正常動作これらのシステムは、従来のサービスとは異なる動作をします。
繰り返し発生するゲートウェイ障害、予期しないブラウザ活動、新しいツールの追加、異常な呼び出しの急増など、疑わしいパターンに対するアラートを追加します。

AIエージェントを自動化機能を持つ特権サービスアカウントとして扱いましょう。AIエージェントは、まさにそういう存在だからです。

終わりに

AIは本質的に安全でも危険でもありません。観測可能かどうか。

AgentCoreは、チームがエージェント型AIを構造化に活用する方法を提供し、Sumo Logicはそれを責任を持って運用するための可視性を提供します。インフラを監視するのと同じ方法でエージェントを監視することで、信頼性、責任の所在、そして信頼性が確保されます。

そうしないと、午前2時にインフラをデプロイしても記録が一切残らないブラックボックスを抱えることになります。

ロギングは、オプションではありません。信頼されるAIオペレーションの基盤です。

AIの安全な利用についてもっと知る

セキュリティユースケース別

オブザーバビリティユースケース別

業界別

競合別

学ぶ

参加する

トレーニング

コミュニティ