ここまでは生成AIモデルやエージェントを扱いました。今回はテキスト分析と音声。これらは自分でモデルを学習させなくても、Foundry Tools(完成済みのAI機能)として、ポータルやコードからすぐ使えます。AI-901シラバスの「テキスト分析を含むアプリを構築する」「Azure Speechで音声アプリを構築する」に対応します。

Foundry Tools(完成済みのAI機能)とは
Foundry Toolsは、テキスト分析・音声・画像などすでに学習済みのAI機能を、アプリに“足せる道具”として提供するものです。コードなし(ポータル)でも、SDK(コード)でも使えます。生成AIモデルが「自分で文章を作る」のに対し、これらは「決まったタスク(分析・変換)をこなす」のが得意です。
テキスト分析(Azure AI Language)
文章を扱うAIはAzure AI Languageが担当します。代表的な手法は次の4つ(ドメイン1の復習)。

- キーワード抽出:主要な語句を取り出す
- エンティティ検出:人名・地名・組織などを見つけて分類
- センチメント分析:肯定的・否定的を判定
- 要約:長い文章の要点をまとめる
たとえば問い合わせメールを自動で「要約+感情判定」するアプリは、これらを組み合わせて作れます。
音声(Azure AI Speech)
音声はAzure AI Speechが担当します。主な機能は3つです。

- 音声認識(Speech to Text):音声を文字に変換。例:会議の文字起こし、音声入力。
- 音声合成(Text to Speech):文字を自然な(ニューラル)音声で読み上げ。例:読み上げ、音声案内。
- 音声翻訳(Speech Translation):話した言葉を別の言語にリアルタイム翻訳。
使い方:コードなしでも、コードでも
- コードなし:FoundryのポータルやSpeech Studioで、画面から試せます。
- コードで:アプリに組み込むときはSDK(テキスト=Language、音声=Speech SDK)やREST APIを使います。
AI-901では「どのタスクに、どのツール(Language/Speech)を使うか」を見分けられればOKです。
確認クイズ
Q1. 会議の録音を自動で文字起こししたい。どの機能?
Q2. 文章を自然な音声で読み上げたい。どの機能?
Q3. 商品レビューが「満足」か「不満」かを判定したい。どのテキスト分析手法?
Q4. テキスト分析や音声などの「完成済みAI機能」をアプリに足せる仕組みの呼び方は?
よくある質問(FAQ)
Q. 音声認識と音声合成の違いは?
A. 音声認識=音→文字(文字起こし)、音声合成=文字→音(読み上げ)。向きが逆です。
Q. テキスト分析と音声は、どのサービスですか?
A. テキスト分析はAzure AI Language、音声はAzure AI Speechです。どちらもFoundry Toolsとして使えます。
Q. コードを書かずに試せますか?
A. はい。ポータルやSpeech Studioから、コードなしで試せます。アプリに組み込むときにSDKを使います。
まとめ
- テキスト分析=Azure AI Language(キーワード抽出・エンティティ検出・センチメント分析・要約)
- 音声=Azure AI Speech(音声認識=音→文字/音声合成=文字→音/音声翻訳)
- どちらも完成済みのFoundry Tools。コードなしでもSDKでも使える
- ➡ 前の記事:Foundryで単一エージェントを作る
- ➡ つぎは「画像の理解と画像生成」(準備中)
- ➡ AI-901対策トップ / 試験概要・受験ガイド
※本記事はMicrosoft公式ドキュメント(Azure AI Language/Azure AI Speech)に基づき、エンジニアKが作成しています。仕様は更新されるため、最新は Microsoft公式 をご確認ください。


コメント