AIワークロードの種類とは?6つを図解【AI-901対策・未経験OK】

AIワークロードの種類(生成AI・エージェント型AI・テキスト分析・音声・コンピュータービジョン・情報抽出)|Azure資格の森 AI-901 Azure AI Fundamentals
無料公式シラバス(AI-901)準拠|ドメイン1「AIの概念と責任」。AIワークロード(AIの仕事の種類)を、未経験から図解で見分けられるように。

AI-901(Azure AI Fundamentals)のドメイン1で問われる「AIワークロードを特定する」。AIワークロードとは、ざっくり言えば「AIにやらせる仕事の“種類”」のこと。試験では「この用途は、どのワークロード?」を見分ける問題がよく出ます。この記事では、主な6種類のワークロードと、よく出るテキスト分析の手法を、身近な例つきで整理します。

1体のロボットが、文章・画像・音声・チャット・ツール操作など、いろいろな種類のタスクを同時にこなしているイメージ図
図:AIには「文章を読む」「画像を見る」「音声を聞く」など、さまざまな仕事の種類があります。

「AIワークロード」とは?

AIワークロードとは、AIが行う仕事の種類(タスクのタイプ)です。たとえば「文章を要約する」「画像から物体を見つける」「音声を文字にする」などは、それぞれ別のワークロードです。種類ごとに使うAzureのサービスやモデルが違うため、「やりたいことは、どのワークロードか?」を見分けることが、AIを使う第一歩になります。

主なAIワークロード6種(全体像)

AI-901で押さえておきたい主なワークロードは、次の6つです。

AIワークロードの種類6つの図。生成AI(新しく作る)、エージェント型AI(自分で考え行動)、テキスト分析(要点・感情を読む)、音声(聞き取り・読み上げ)、コンピュータービジョン(画像理解)、情報抽出(書類等から取り出す)
  • 生成AI:文章・画像などを新しく作り出す。例:メールの下書き、画像生成。
  • エージェント型AI:目標を与えると自分で手順を考え、ツールを使って行動する。例:予約の検索→比較→実行まで自動化。
  • テキスト分析(NLP):文章の要点・感情・固有名詞などを読み取る。例:レビューの感情判定。
  • 音声:話し言葉を文字にしたり、文字を読み上げたりする。例:会議の文字起こし、読み上げ。
  • コンピュータービジョン:画像から物体・文字・顔などを理解する。例:写真の仕分け、文字の読み取り。
  • 情報抽出:書類・画像・音声・動画から必要な情報を構造化して取り出す。例:請求書から日付・金額を抜き出す。
生成AI と エージェント型AI の違い:生成AIは「求めに応じてコンテンツを作る」。エージェント型AIは「目標に向けて自分で計画し、ツールを使って行動まで進める」。エージェントは生成AIを“頭脳”として使い、さらに手足を持つイメージです。

テキスト分析の4つの手法

テキスト分析(文章を扱うAI)は、AI-901でとくに出やすいテーマです。代表的な4つの手法を押さえましょう。

テキスト分析の4つの手法の図。キーワード抽出(主要な語句を取り出す)、エンティティ検出(人名・地名・組織を分類)、センチメント分析(肯定的・否定的を判定)、要約(長い文章の要点をまとめる)
  • キーワード抽出:文章の中の主要な語句(キーフレーズ)を取り出す。例:問い合わせ文から要点語を抜く。
  • エンティティ検出(固有表現認識):文章中の人名・地名・組織・日付などを見つけて種類分けする。例:「山田さんが東京で…」→人名・地名を識別。
  • センチメント分析:文章が肯定的か否定的か(感情)を判定する。例:商品レビューが満足/不満か。
  • 要約:長い文章を短くまとめる。例:長い議事録の要点を抽出。

音声とコンピュータービジョン

音声と画像のワークロードも、よく出ます。代表的な機能は次のとおりです。

音声とコンピュータービジョンの図。音声=音声認識(話し言葉を文字に)・音声合成(文字を話し言葉に)。コンピュータービジョン=画像分類・物体検出・文字の読み取り(OCR)・顔検出
  • 音声認識(Speech to Text):話し言葉を文字に変換。例:会議の文字起こし、音声入力。
  • 音声合成(Text to Speech):文字を自然な話し言葉で読み上げ。例:読み上げアプリ、音声案内。
  • コンピュータービジョン:画像分類(何が写っているか)、物体検出(どこに何があるか)、OCR(文字の読み取り)顔検出など。
音声認識 ↔ 音声合成は逆向き:認識=音→文字合成=文字→音。「文字起こし」は音声認識、「読み上げ」は音声合成、と覚えましょう。

情報抽出(書類・画像・音声・動画から)

情報抽出は、書類・画像・音声・動画などから必要な情報を構造化して取り出すワークロードです。AzureではContent Understandingという機能が担当します(くわしくはドメイン2で解説)。

OCR と 情報抽出の違い:OCR=画像の文字を「読む」だけ情報抽出=読んだ内容から、必要な項目(日付・金額・氏名など)を“構造化して”取り出す。情報抽出はOCRの一歩先、と考えると整理できます。
📝 AI-901 試験のポイント

  • 主なワークロード=生成AI/エージェント型AI/テキスト分析/音声/コンピュータービジョン/情報抽出
  • テキスト分析の4手法=キーワード抽出・エンティティ検出・センチメント分析・要約。シナリオで見分ける
  • ひっかけ:感情判定→センチメント分析文字起こし→音声認識画像の中身→コンピュータービジョン書類から項目を構造化→情報抽出

確認クイズ

Q1. 商品レビューが「満足」か「不満」かを自動で判定したい。どのテキスト分析手法?

A. センチメント分析
B. キーワード抽出
C. 要約
D. エンティティ検出

Q2. 写真に写っているのが「犬」か「猫」かを判定したい。どのワークロード?

A. テキスト分析
B. コンピュータービジョン
C. 音声
D. 情報抽出

Q3. 会議の録音を、自動で文字起こししたい。どの機能?

A. 音声認識(Speech to Text)
B. 音声合成(Text to Speech)
C. OCR
D. キーワード抽出

Q4. 請求書の画像から、日付・金額・取引先を「構造化して」自動で取り出したい。どのワークロード?

A. 音声
B. センチメント分析
C. 情報抽出
D. 生成AI

よくある質問(FAQ)

Q. コンピュータービジョンの「OCR」と「情報抽出」はどう違いますか?

A. OCRは画像の文字を「読む」だけ情報抽出は、読んだ内容から必要な項目(日付・金額・氏名など)を“構造化して”取り出します。情報抽出はOCRの一歩先、と考えると整理できます。

Q. 生成AIとエージェント型AIの違いは?

A. 生成AIは求めに応じてコンテンツを「作る」。エージェント型AIは目標に向けて自分で計画し、ツールを使って「行動まで進める」。エージェントは生成AIを頭脳として使い、さらに手足を持つイメージです。

Q. これらはどのAzureサービスで使えますか?

A. テキスト分析はAzure AI Language、音声はAzure AI Speech、画像はAzure AI Visionなどが対応します。AI-901では「どのワークロード/手法か」を見分けられればOKで、サービスの細かい操作は実装記事(ドメイン2)で扱います。

まとめ

  • 主なAIワークロード=生成AI・エージェント型AI・テキスト分析・音声・コンピュータービジョン・情報抽出
  • テキスト分析4手法=キーワード抽出・エンティティ検出・センチメント分析・要約。シナリオで見分ける
  • 感情→センチメント/文字起こし→音声認識/画像の中身→ビジョン/書類から項目→情報抽出が定番のひっかけ
🎯 次のステップ

※本記事はMicrosoft公式ドキュメント(Azure AI Language/Vision/Speech ほか)およびAI-901公式試験ガイドに基づき、エンジニアKが作成しています。製品仕様は更新されるため、最新は Microsoft公式情報 をご確認ください。

コメント

タイトルとURLをコピーしました