記事公開日
【AWS re:Invent 2025】Expo会場で受けた衝撃。Datadog Bits AI SREが実現する「自律型インシデント解決」

AWS re:Invent 2025のExpo会場で、私は大きな衝撃を受けました。Datadogブースで紹介されていた「Bits AI SRE」です。
このAI機能は、インシデント対応のあり方を根本から覆すものでした。アラート発生後の根本原因特定にかかる時間と工数を、AIが数分で自律的に処理するのです。
本記事では、re:Inventの開催に合わせて一般提供(GA)が発表された、SREのための革新的なAIエージェント、Bits AI SREについて、ブースで伺った情報を基にご紹介いたします。
Datadog Bits AI SREとは? SREのための「自律型AIエージェント」
Bits AI SREは、Datadogの広範なオブザーバビリティデータ(メトリクス、ログ、トレース)を基盤として、インシデント対応ワークフロー全体を自動化するために設計されたドメイン特化型AIエージェントです。
定義: アラート発生時にテレメトリ、アーキテクチャ、組織のコンテキストを認識し、数分で実行可能な根本原因を提示するAIエージェント。SREのオンコール負担を劇的に軽減します。
サービス開始時期: 2025年6月のDASHにて限定提供が始まり、AWS re:Invent 2025の時期に一般提供が発表されました。
Bits AI SREの目的は、オンコール担当者がログインする前に調査を完了させ、MTTR(平均復旧時間)を大幅に短縮することにあります。
インシデント調査の常識を覆す「科学的な問題解決プロセス」
Bits AI SREの最も革新的な側面は、アラート受信後の調査プロセスです。単なるデータ提示ではなく、人間のSREが問題解決を行うのと同じ科学的・体系的な手順を瞬時に実行します。
調査プロセスは以下の要素で構成され、調査結果として提供されます。
-
① 仮説の立案 (Hypothesis): アラートに基づき、複数の根本原因の仮説(例:最近のデプロイメント起因、リソース枯渇、依存サービスの問題など)を自動で立てる。
-
② 証拠の収集と研究の手順 (Evidence & Research Steps): 立てた仮説を検証するため、関連するログ、トレース、過去のインシデントレポート、ランブックを高速で分析。どのような手順で検証を行ったか(研究の手順)も明確に示します。
-
③ 結論と最良の証拠の特定 (Conclusion & Best Evidence): 収集した証拠に基づき、最も確度の高い根本原因の結論を導き出し、それを裏付ける最良の証拠(該当するログ行、エラーが発生したトレースなど)をピンポイントで提示します。
この機能により、エンジニアは数時間かかっていたログやメトリクスを調査する作業から解放されます。

OpenAIによる強化:雑なプロンプトでも結果を出す「賢さ」
Bits AI SREは、OpenAIなどの生成AI技術を応用し、実用性の高いインターフェースを実現しています。
-
コンテキストを理解する: DatadogのデータとOpenAIの能力を組み合わせることで、多少曖昧なプロンプトや日常会話のような質問であっても、プラットフォーム全体のコンテキスト(サービス構成、リソース名など)を深く理解し、的確な結果を提示します。
-
詳細な情報の表示: 画像の通り「この障害の詳細を教えて」といった質問に対し、概要だけでなく、それを裏付ける詳細な情報や分析結果を表示できます。

Git連携:発見から「プルリクエスト」までを完結
Bits AI SREの真価は、インシデントの診断に留まらず、その後の修正フェーズまでをシームレスに支援する点にあります。
-
修正提案の生成: 根本原因がコードのバグや設定ミスに起因する場合、Bits AI SREは問題のあるファイルとその該当箇所を特定し、具体的なコードの修正提案を行います。
-
自動的なプルリクエスト作成: さらに、その修正提案に基づき、GitHubやGitLabなどのリポジトリに対してプルリクエストを作成する機能も備えています。
これは、インシデント対応サイクル全体(診断→修正→デプロイ)のうち、「診断」から「修正」までをAIが支援し、真のDevOpsサイクルの実現を加速することを意味します。
まとめ:Bits AI SREが実現する「オンコールからの解放」
AWS re:Invent 2025で目の当たりにしたDatadog Bits AI SREは、インシデント対応のあり方を根本から変えるものでした。
このAIエージェントの価値は、その強力な分析能力だけでなく、分析結果の提示方法にもあります。Bits AI SREが導き出した「仮説」「証拠」「結論」は、単なるテキストの羅列ではなく、一目で理解できる非常に整理されたUI/UXで表示されていると感じました。
この技術は単なる自動化以上の価値を持ちます。エンジニアの貴重な時間を深夜のログ調査から解放し、顧客価値の創出やシステムの信頼性向上という、本来注力すべき創造的な活動に集中できる未来を実現するからです。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
もし「このサービスについて知りたい」「AWS環境の構築、移行」などのリクエストがございましたら、弊社お問合せフォームまでお気軽にご連絡ください。 複雑な内容に関するお問い合わせの場合には直接営業からご連絡を差し上げます。 また、よろしければ以下のリンクもご覧ください!
<QES関連ソリューション/ブログ>
<QESが参画しているAWSのセキュリティ推進コンソーシアムがホワイトペーパーを公開しました>
※Amazon Web Services、”Powered by Amazon Web Services”ロゴ、およびブログで使用されるその他のAWS商標は、米国その他の諸国における、Amazon.com, Inc.またはその関連会社の商標です。


