記事公開日
最終更新日
Microsoft Ignite 2024のキーノートをAzure Video Indexerにかけてみた話

現在、Microsoft Igniteに参加するためにアメリカのシカゴに来ております。
やはりサティア・ナデラは大人気。
キーノートは大盛況で会場は満員御礼でしたが、何とか席に着くことができました。
今回は、そのキーノートをAzure Video Indexerにかけて分析してみたいと思います。
1.良く使われていたキーワード
まずは「AI」
ほぼすべての時間帯でAIという言葉が使われていることが分かります。
確かにずっと何かに絡めてAIの話をしていました。
次に「Copilot」
こちらも出現率の高いワードとなりました。
実際使うと、まだ「ん~」と思う人が多いと思いますが、力の入れようが伺えます。
しばらくは、Copilot自体がどうこう議論するのではなく、Azureや365全体の利便性がCopilotによってどのように向上するのか、その体験を感じることが重要になると思います。
特にSIerとしては、それを感じてどう動くのかが非常に重要です。
次に「Agents」
こちらは、ただのAIチャットボットから先に進むためのキーワードですね。
今回のIngiteの注目キーワードで間違いありません。
関連ワードとして「multi」もかなり使われています。
使われ方としてはこんな感じです。
multi agent
multi modal
multi cloud
multi layer
その他「Data」や「Security」、「Fabric」なんて言葉もAIに関連して多く使われていた印象です。
個人的には、Azure以外に置かれているデータをどうのようにAzure連携(カタログ化)するかが鍵だと思うので、Fabricに注目していきたいと思います。
補足
Azure Video Indexerによる英語音声の解析では、キーワードが30個出ていました。
検証が足りていない部分があるかもしれませんが、日本語音声だと「ええ」とか「あぁ」のような話を繋ぐだけの言葉などを数個拾ってきて、実質的に機能していないように見受けられます。
(Indexerの成果物を見ましたが、日本語は考慮されていない処理があるんだろうなと想像。)
文書内で良く使われていたり、ワード的に強いものなどを自動的に選定し、自動的に投入してくれると嬉しいのですが、英語だと、おそらくそうなっている可能性がありそうだなと気付きました。
2.感情
Azure Vdeo Indexer では感情を測ることができます。今回の内容だと、あまり参考になる情報ではありませんが、
結果としては、感情の種類では「喜び」、傾向(下の画面では2感情)では「積極的」が多くAIに判定されています。

3.観察された人
2時間50分程度の動画で、同一人物を統合してあげる必要がありそうですが、かなりの数の人が検出されました。(Ingiteの動画は公開情報なので、人物の画像もアップして大丈夫でしょう)

4.要約
Azure Vdeo Indexer の機能による要約です。長さは「Long」を選択。動画が長いので、出力されるまでに結構時間がかかりました。
長時間の動画なので、要約自体の精度が心配なのとプロンプトが変更できないので、できることが限られてしまうのが残念ですが、、
以下は、英語版の要約をGPTで翻訳した内容です。
※内容に誤り等ある可能性があるため、テキストを画像にしました。
「こんな感じで要約されるよ」を紹介する用です。

5.まとめ
本来であればキーノートの分析や要約をしたものと実際の発言を検証をしなくてはいけないのですが、少なくとも言語差は結構ありそうだなと感じる結果となりました。また、今後Copilotが付属してくるか来ないかで、マイクロソフト社がその製品に力を入れているのかを測れるかもしれません。
現時点でAzure Video IndexerにCopilotは付与されていません。
Azure Video IndexerやAzure OpenAIを利用した開発のご相談等あれば、お気軽にお問い合わせください。
※このブログで参照されている、Microsoft、Windows、Microsoft Azure、その他のマイクロソフト製品およびサービスは、米国およびその他の国におけるマイクロソフトの商標または登録商標です。