Content Understandingで情報抽出|書類・画像・音声・動画から構造化【AI-901】

Azure Content Understandingで書類・画像・音声・動画から情報を構造化抽出|Azure資格の森 AI-901 Azure AI Fundamentals
無料公式シラバス(AI-901)準拠|ドメイン2「Foundryで実装する」の最後のテーマ。書類・画像・音声・動画から、必要な情報を“構造化して”取り出します。

請求書から「日付・金額・取引先」を抜き出したり、通話録音から要点を整理したり——こうした情報抽出を担うのがAzure Content Understandingです。生成AIを使って、バラバラな(非構造の)データきれいな構造化データに変えます。AI-901シラバスの「Content Understandingでドキュメント・画像・音声・動画から情報を抽出する」に対応します。

ロボットが書類・画像・音声・動画をアナライザーに入れると、項目が整理された構造化データの表が出てくるイメージ図

Content Understanding とは

Content Understandingは、Foundry Toolのひとつ。生成AIで非構造データ(書類・画像・音声・動画)を読み取り、あなたが決めた形(スキーマ)に沿って項目(フィールド)を取り出します。複雑なプロンプトを書かなくても、「取り出したい項目」を定義するだけで構造化できます。

4種類の入力に対応(マルチモーダル)

Content Understandingが扱える入力:書類・画像・音声・動画を、構造化データに変換する図
  • 書類:請求書・契約書・申請書など
  • 画像:写真・スキャン
  • 音声:通話・録音(文字起こしして分析)
  • 動画:動画ファイル(場面ごとに分析)

これらを共通のしくみで処理し、表やJSONのような構造化データにして返します。

「OCR」との違い(構造化がカギ)

OCR(画像の文字をそのまま読む)と情報抽出(必要な項目を構造化して取り出す)の違いの図
  • OCR:画像の文字をそのまま読むだけ(全文をテキスト化)。
  • 情報抽出(Content Understanding):読んだ内容から必要な項目だけを“構造化して”取り出す(例:日付・金額・取引先をフィールドに)。

つまり情報抽出はOCRの一歩先。さらに、信頼度スコア(その値がどれだけ確かか)も付くので、人の確認を減らして自動化できます。請求書処理(IDP)や、RAG用のデータ取り込みなどに使われます。

使い方

  • コードなし:Foundry や Content Understanding Studio から、取り出す項目(スキーマ)を決めて試せます。
  • コードで:アプリに組み込むときは REST API / SDK を使います。

よくある用途には定型の「prebuilt(組み込み)アナライザー」があり、自分用にカスタムも作れます。

📝 AI-901 試験のポイント

  • Content Understanding=書類・画像・音声・動画から、必要な項目を構造化して抽出するFoundry Tool
  • スキーマ(取り出す項目)を定義してフィールド抽出。信頼度スコアつきで自動化しやすい
  • OCR=文字を読むだけ/情報抽出=項目を構造化(一歩先)

確認クイズ

Q1. 請求書の画像から「日付・金額・取引先」を構造化して取り出したい。どれ?

A. Content Understanding(情報抽出)
B. 画像生成
C. 音声合成
D. センチメント分析

Q2. Content Understanding が扱える入力はどれ?

A. 書類・画像・音声・動画(すべて)
B. 書類だけ
C. 画像だけ
D. 音声だけ

Q3. 「OCR」と比べた、情報抽出(Content Understanding)の特徴は?

A. 必要な項目を構造化して取り出す
B. 文字をそのまま全文テキスト化するだけ
C. 画像を新しく生成する
D. 音声を読み上げる

Q4. Content Understanding で「取り出す項目」を決めるものは?

A. スキーマ(取り出す項目の定義)
B. temperature
C. エンドポイント
D. トークン

よくある質問(FAQ)

Q. Content Understanding と OCR の違いは?

A. OCRは文字を読むだけContent Understanding は必要な項目を構造化して取り出します(音声・動画も扱えます)。情報抽出はOCRの一歩先です。

Q. どんな用途に使いますか?

A. 請求書・契約書の自動処理(IDP)、通話録音の分析、RAG用のデータ取り込みなど、非構造データを業務で使える形に変える場面です。

Q. どう使いますか?

A. Foundry や Content Understanding Studio から、取り出す項目(スキーマ)を決めて使います。アプリに組み込むときは REST API / SDK です。

まとめ

  • Content Understanding=書類・画像・音声・動画から、必要な項目を構造化して抽出するFoundry Tool
  • スキーマで取り出す項目を定義。信頼度スコアつきで自動化しやすい
  • OCR=文字を読むだけ/情報抽出=項目を構造化(一歩先)
🎉 これでAI-901の出題範囲をひと通りカバーしました!
ドメイン1(AIの概念と責任)とドメイン2(Foundryで実装)の全テーマがそろいました。AI-901対策トップから各記事を復習し、試験概要で受験の準備も進めましょう。

※本記事はMicrosoft公式ドキュメント(Azure Content Understanding)に基づき、エンジニアKが作成しています。仕様は更新されるため、最新は Microsoft公式 をご確認ください。

コメント

タイトルとURLをコピーしました