請求書から「日付・金額・取引先」を抜き出したり、通話録音から要点を整理したり——こうした情報抽出を担うのがAzure Content Understandingです。生成AIを使って、バラバラな(非構造の)データをきれいな構造化データに変えます。AI-901シラバスの「Content Understandingでドキュメント・画像・音声・動画から情報を抽出する」に対応します。

Content Understanding とは
Content Understandingは、Foundry Toolのひとつ。生成AIで非構造データ(書類・画像・音声・動画)を読み取り、あなたが決めた形(スキーマ)に沿って項目(フィールド)を取り出します。複雑なプロンプトを書かなくても、「取り出したい項目」を定義するだけで構造化できます。
4種類の入力に対応(マルチモーダル)

- 書類:請求書・契約書・申請書など
- 画像:写真・スキャン
- 音声:通話・録音(文字起こしして分析)
- 動画:動画ファイル(場面ごとに分析)
これらを共通のしくみで処理し、表やJSONのような構造化データにして返します。
「OCR」との違い(構造化がカギ)

- OCR:画像の文字をそのまま読むだけ(全文をテキスト化)。
- 情報抽出(Content Understanding):読んだ内容から必要な項目だけを“構造化して”取り出す(例:日付・金額・取引先をフィールドに)。
つまり情報抽出はOCRの一歩先。さらに、信頼度スコア(その値がどれだけ確かか)も付くので、人の確認を減らして自動化できます。請求書処理(IDP)や、RAG用のデータ取り込みなどに使われます。
使い方
- コードなし:Foundry や Content Understanding Studio から、取り出す項目(スキーマ)を決めて試せます。
- コードで:アプリに組み込むときは REST API / SDK を使います。
よくある用途には定型の「prebuilt(組み込み)アナライザー」があり、自分用にカスタムも作れます。
確認クイズ
Q1. 請求書の画像から「日付・金額・取引先」を構造化して取り出したい。どれ?
Q2. Content Understanding が扱える入力はどれ?
Q3. 「OCR」と比べた、情報抽出(Content Understanding)の特徴は?
Q4. Content Understanding で「取り出す項目」を決めるものは?
よくある質問(FAQ)
Q. Content Understanding と OCR の違いは?
A. OCRは文字を読むだけ。Content Understanding は必要な項目を構造化して取り出します(音声・動画も扱えます)。情報抽出はOCRの一歩先です。
Q. どんな用途に使いますか?
A. 請求書・契約書の自動処理(IDP)、通話録音の分析、RAG用のデータ取り込みなど、非構造データを業務で使える形に変える場面です。
Q. どう使いますか?
A. Foundry や Content Understanding Studio から、取り出す項目(スキーマ)を決めて使います。アプリに組み込むときは REST API / SDK です。
まとめ
- Content Understanding=書類・画像・音声・動画から、必要な項目を構造化して抽出するFoundry Tool
- スキーマで取り出す項目を定義。信頼度スコアつきで自動化しやすい
- OCR=文字を読むだけ/情報抽出=項目を構造化(一歩先)
ドメイン1(AIの概念と責任)とドメイン2(Foundryで実装)の全テーマがそろいました。AI-901対策トップから各記事を復習し、試験概要で受験の準備も進めましょう。
- ➡ 前の記事:画像の理解と画像生成
- ➡ AI-901対策トップ(全記事を復習) / 試験概要・受験ガイド
※本記事はMicrosoft公式ドキュメント(Azure Content Understanding)に基づき、エンジニアKが作成しています。仕様は更新されるため、最新は Microsoft公式 をご確認ください。

コメント