テキスト分析と音声アプリ|Azure AI Language / Speech【AI-901】

テキスト分析(Azure AI Language)と音声(Azure AI Speech)|Azure資格の森(AI-901対策) AI-901 Azure AI Fundamentals
無料公式シラバス(AI-901)準拠|ドメイン2「Foundryで実装する」。完成済みのAI機能(テキスト分析・音声)を、Foundryの“道具”として使います。

ここまでは生成AIモデルやエージェントを扱いました。今回はテキスト分析音声。これらは自分でモデルを学習させなくても、Foundry Tools(完成済みのAI機能)として、ポータルやコードからすぐ使えます。AI-901シラバスの「テキスト分析を含むアプリを構築する」「Azure Speechで音声アプリを構築する」に対応します。

ロボットが文章を分析しつつ、マイクで音声を聞き取りスピーカーで読み上げる、テキストと音声を扱うイメージ図

Foundry Tools(完成済みのAI機能)とは

Foundry Toolsは、テキスト分析・音声・画像などすでに学習済みのAI機能を、アプリに“足せる道具”として提供するものです。コードなし(ポータル)でも、SDK(コード)でも使えます。生成AIモデルが「自分で文章を作る」のに対し、これらは「決まったタスク(分析・変換)をこなす」のが得意です。

テキスト分析(Azure AI Language)

文章を扱うAIはAzure AI Languageが担当します。代表的な手法は次の4つ(ドメイン1の復習)。

テキスト分析の4手法:キーワード抽出・エンティティ検出・センチメント分析・要約
  • キーワード抽出:主要な語句を取り出す
  • エンティティ検出:人名・地名・組織などを見つけて分類
  • センチメント分析:肯定的・否定的を判定
  • 要約:長い文章の要点をまとめる

たとえば問い合わせメールを自動で「要約+感情判定」するアプリは、これらを組み合わせて作れます。

音声(Azure AI Speech)

音声はAzure AI Speechが担当します。主な機能は3つです。

Azure AI Speechの主な機能:音声認識(音声を文字に)・音声合成(文字を自然な音声に)・音声翻訳(話した言葉を別の言語に)
  • 音声認識(Speech to Text):音声を文字に変換。例:会議の文字起こし、音声入力。
  • 音声合成(Text to Speech):文字を自然な(ニューラル)音声で読み上げ。例:読み上げ、音声案内。
  • 音声翻訳(Speech Translation):話した言葉を別の言語にリアルタイム翻訳。
マルチモーダルで音声応答:音声に対応したマルチモーダルモデルを使うと、話しかけて、音声で答えてもらう音声アシスタントのような体験も作れます。音声認識=音→文字/音声合成=文字→音(向きが逆)と覚えましょう。

使い方:コードなしでも、コードでも

  • コードなし:FoundryのポータルやSpeech Studioで、画面から試せます。
  • コードで:アプリに組み込むときはSDK(テキスト=Language、音声=Speech SDK)やREST APIを使います。

AI-901では「どのタスクに、どのツール(Language/Speech)を使うか」を見分けられればOKです。

📝 AI-901 試験のポイント

  • テキスト分析=Azure AI Language(キーワード抽出・エンティティ検出・センチメント分析・要約)
  • 音声=Azure AI Speech(音声認識=音→文字/音声合成=文字→音/音声翻訳)
  • これらは完成済みのFoundry Tools。コードなし(ポータル)でもSDKでも使える

確認クイズ

Q1. 会議の録音を自動で文字起こししたい。どの機能?

A. 音声認識(Speech to Text)
B. 音声合成(Text to Speech)
C. キーワード抽出
D. 要約

Q2. 文章を自然な音声で読み上げたい。どの機能?

A. 音声認識(Speech to Text)
B. 音声合成(Text to Speech)
C. エンティティ検出
D. 音声翻訳

Q3. 商品レビューが「満足」か「不満」かを判定したい。どのテキスト分析手法?

A. センチメント分析
B. 要約
C. 音声認識
D. キーワード抽出

Q4. テキスト分析や音声などの「完成済みAI機能」をアプリに足せる仕組みの呼び方は?

A. Foundry Tools(完成済みのAI機能)
B. トークン
C. エンドポイント
D. temperature

よくある質問(FAQ)

Q. 音声認識と音声合成の違いは?

A. 音声認識=音→文字(文字起こし)、音声合成=文字→音(読み上げ)。向きが逆です。

Q. テキスト分析と音声は、どのサービスですか?

A. テキスト分析はAzure AI Language、音声はAzure AI Speechです。どちらもFoundry Toolsとして使えます。

Q. コードを書かずに試せますか?

A. はい。ポータルやSpeech Studioから、コードなしで試せます。アプリに組み込むときにSDKを使います。

まとめ

  • テキスト分析=Azure AI Language(キーワード抽出・エンティティ検出・センチメント分析・要約)
  • 音声=Azure AI Speech(音声認識=音→文字/音声合成=文字→音/音声翻訳)
  • どちらも完成済みのFoundry Tools。コードなしでもSDKでも使える
🎯 次のステップ

※本記事はMicrosoft公式ドキュメント(Azure AI Language/Azure AI Speech)に基づき、エンジニアKが作成しています。仕様は更新されるため、最新は Microsoft公式 をご確認ください。

コメント

タイトルとURLをコピーしました