Azure AI Search (旧称 "Azure Cognitive Search") でキーフレーズ抽出
※2024/1/10 Azure Cognitive Searchの言葉のみAzure AI Searchへと変更しております。
そのため、画像や機能の一部は当時のままの表記となりますのでご注意ください。
今回は「Azure AI Search」のキーフレーズ抽出スキルを試してみたいと思います。
キーフレーズ抽出を行うことで自然言語の中からキーフレーズのリストが取得でき、フィルタリングや他のスキルと組み合わせたりすることが出来るようになります。
ただ、初期設定のままだと思ったようなフレーズが取得できないため、注意が必要です。
初期設定での結果を確認
「Azure AI Search」ではインデックスを作成する際に「データのインポート」ウィザードが用意されています。その中で「コグニティブ スキルを追加する」のステップで以下のように「キーフレーズを抽出」にチェックすることで簡単にキーフレーズ抽出スキルを使用することができます。
今回は、弊社システムソリューションの一覧にある文言を対象にインデックスを作成してみました。
キーフレーズ抽出の結果は以下のようになりました。
日本語のキーフレーズが上手く取得できていないことが分かるかと思います。
これはキーフレーズ抽出スキルの対象言語が既定で英語になっていることが原因となります。
言語設定を変更して結果を確認
Azure Portalで使用しているスキルセットの詳細画面にアクセスします。JSON形式で定義されているスキルのうち以下の部分を「en」から「ja」に変更して保存します。
インデックスをリセットして改めてインデックスを作りなおします。
結果、以下のようにフレーズの取得が改善されていることが分かるかと思います。
まとめ
「Azure AI Search」に用意されているキーフレーズ抽出スキルを使用する際、初期設定では日本語に対応できないためスキル定義の変更が必要になってきます。「Azure AI Search」には他にも多くのスキルが用意されています。それらについても初期設定のままだと思ったような結果が取得できない場合があるかもしれません。その場合は、スキル定義を見直すことで改善されるかもしれません。
本ブログで興味を持たれましたらご支援等させていただきますので
是非、以下の「お問い合わせフォーム」から気軽にお問合せください!
QESでは、Microsoft製品やAWS製品に関するソリューションに取り組んでおります。
他プロダクトに関するブログも投稿しておりますので、下記のリンクから是非ご覧ください。
また、QESでは採用活動を強化しております。
ブログを読んで弊社の業務内容に興味を持っていただけましたら、採用情報にもお目通しいただければ幸いです。
https://www.qes.co.jp/recruit.html
※このブログで参照されている、Microsoft、Windows、Azureその他のマイクロソフト製品およびサービスは、米国およびその他の国におけるマイクロソフトの商標または登録商標です。