生成AIモデルのしくみと選び方|AI-901向けに図解【未経験OK】

生成AIモデルのしくみと選び方|Azure資格の森(AI-901対策) AI-901 Azure AI Fundamentals
無料公式シラバス(AI-901)準拠|ドメイン1「AIの概念と責任」。生成AIモデルのしくみ・選び方・設定を、未経験から図解で。

AI-901(Azure AI Fundamentals)のドメイン1で問われる「AIモデルのコンポーネントと構成」。ここでは大きく3つ——①生成AIモデルが動くしくみ ②用途に合うモデルの選び方 ③デプロイと設定パラメーター——が出ます。むずかしい数式は不要。「AIが文章をどう作り、どう選んで、どう調整するか」を、身近なイメージでつかみましょう。

ロボットが、入ってくる文章から学び、単語のブロックを1つずつ並べて次の言葉を予測して文章を作るイメージ図
図:生成AIは「次に来る言葉」を予測し、1語ずつ文章を組み立てていきます。

そもそも「AIモデル」って何?

AIモデルとは、大量のデータからパターンを学んだ「予測する仕組み」のことです。たとえば「ね・こ・が・…」と来たら、次は「鳴いた」かな、と続きを予測します。中でも生成AIは、学んだことをもとに新しいコンテンツ(文章・画像・音声など)を作り出すAIです。ChatGPTのようなチャットAIは、この生成AIの代表例です。

生成AIが文章を作るしくみ(4ステップ)

生成AIが文章を作る流れは、ざっくり次の4ステップです。

生成AIが文章を作るしくみの4ステップの図。1.文章をトークンに分ける、2.意味を数値ベクトルに変換、3.文脈を読み取る(Transformer)、4.次の言葉を予測して1語ずつ生成
  1. 文章をトークンに分ける:AIは文章をそのままではなく、「トークン」という小さなかたまり(単語や文字の一部)に分けて扱います。トークンは料金や長さの単位にもなります。
  2. 意味を数値(ベクトル)にする:各トークンの意味を数字の並び(ベクトル)で表します。これを埋め込み(embedding)といい、意味が近い言葉は数値も近くなります(例:「犬」と「猫」は近い)。
  3. 文脈を読み取る(Transformer):Transformer(トランスフォーマー)という仕組みが、トークン同士の関係を見て文脈(どの言葉がどの言葉に関係するか)をつかみます。
  4. 次の言葉を予測して生成:ここまでの流れから「次に来る可能性が高いトークン」を選び、1語ずつつなげて文章を作ります。
ひとことで:生成AIは「巨大な“次の言葉あてゲーム”」。だからときどき、もっともらしいけど事実とちがう答え(ハルシネーション)も出ます。なお、文章だけでなく画像・音声もまとめて扱えるモデルをマルチモーダルと呼びます。

用途に合うモデルの選び方

AzureのAI開発ツール「Microsoft Foundry」には、たくさんのAIモデルが並ぶ「モデルカタログ」があります。その中から用途に合うモデルを選んで使います。選ぶときの観点は次の5つです。

モデル選びの5つの観点の図。モダリティ(何を扱うか)、能力(精度・賢さ)、コスト(料金)、速度(応答の速さ)、コンテキスト長(一度に扱える量)
  • モダリティ:何を入力・出力するか。テキスト生成/画像生成/埋め込み(検索向け)/音声など、目的に合った種類を選ぶ。
  • 能力:どれだけ賢く・正確か。難しいタスクほど高性能なモデルが必要。
  • コスト:高性能なモデルほど料金が高い傾向。用途に対して過剰でないか。
  • 速度(レイテンシ):応答の速さ。チャットなど即時性が要る用途では重要。
  • コンテキスト長:一度に扱えるトークンの量。長い資料を丸ごと読ませたいなら、コンテキスト長が大きいモデルを選ぶ。

ポイントは「いつも最高性能を選べばよいわけではない」こと。能力・コスト・速度のバランスを、用途に合わせて取るのが正解です。

モデルのデプロイと構成パラメーター

使いたいモデルを選んだら、デプロイします。デプロイとは、モデルを「使える状態」にして、呼び出すための窓口(エンドポイント)を作ることです。Foundryでは、主に次の2つの方法があります。

  • サーバーレス API:従量課金(使った分だけ支払い)で、Microsoftが管理するインフラ上のモデルをAPIとして手軽に使う方法。自分でサーバーを用意せず、低コスト・かんたんに始められます。
  • マネージド計算(専用コンピュート):モデルを専用の計算リソースにホストする方法。専有できるぶん、要件が厳しい場合などに使います。

さらに、答え方を調整する構成パラメーターがあります。代表がtemperature(テンパラチャー/温度)です。

temperature(温度)の効果の図。低い(0に近い)と堅実・一貫した答え(事実の質問・要約向け)、高い(2に近い)と多様・創造的な答え(アイデア出し・物語向け)
  • temperature(温度):答えの「ふり幅(ランダムさ)」を調整。低い(0に近い)=堅実で一貫(事実確認・要約向き)、高い=多様で創造的(アイデア出し・物語向き)。値は0〜2で、既定は1.0です。
  • top_p:temperatureとは別の、ふり幅の調整方法(上位の候補だけから選ぶ)。temperatureとtop_pは、両方ではなくどちらか片方を調整するのが推奨です。
  • 最大トークン数(max tokens):1回で生成する最大の長さ。長く答えさせたいときは大きく設定します。
📝 AI-901 試験のポイント

  • 生成AI=トークン化→埋め込み→Transformerで文脈把握→次のトークンを予測して1語ずつ生成
  • モデル選び=モダリティ・能力・コスト・速度・コンテキスト長のバランス(Foundryのモデルカタログから)
  • temperature 低=堅実/高=創造的。temperatureとtop_pは片方だけ。手軽なデプロイ=サーバーレスAPI(従量課金)

確認クイズ

Q1. 生成AIが文章を作るとき、基本的にどうやって次の単語を決めますか?

A. 直前までの流れから「次に来る可能性が高いトークン」を予測する
B. 辞書の単語を上から順番に並べる
C. 完全にランダムに選ぶ
D. 人が毎回その場で入力する

Q2. AIが文章を分けて扱う、小さなかたまりの単位を何と呼びますか?

A. トークン
B. エンドポイント
C. パラメーター
D. デプロイ

Q3. 事実確認や要約のため、答えを「堅実で一貫」させたいとき、temperatureはどうしますか?

A. 低くする(0に近づける)
B. 高くする(2に近づける)
C. temperatureとtop_pを同時に上げる
D. 最大トークン数を増やす

Q4. 自分でサーバーを用意せず、従量課金でモデルをAPIとして手軽に使いたい。Foundryのどのデプロイ方法?

A. サーバーレス API デプロイ
B. マネージド計算(専用コンピュート)
C. 自分のPCにインストール
D. オンプレミスのサーバーを購入

よくある質問(FAQ)

Q. 「トークン」って結局なんですか?

A. 文章を分けた小さなかたまりです(単語や文字の一部)。AIはトークン単位で処理し、料金や入出力の長さもトークン数で数えます。日本語はおおよそ1文字=1〜2トークン程度が目安です。

Q. temperatureとtop_pは両方調整していいですか?

A. どちらか片方の調整が推奨です。両方を同時に動かすと効果が読みづらくなります。まずはtemperatureだけで十分です。

Q. 結局どのモデルを選べばいいですか?

A. まず用途(モダリティ)で絞り、つぎに能力・コスト・速度・コンテキスト長のバランスで決めます。Foundryのモデルカタログで比較できます。「とりあえず一番高性能」ではなく、用途に見合うものを選ぶのがコツです。

まとめ

  • 生成AIのしくみ=トークン化 → 埋め込み(数値化)→ Transformerで文脈把握 → 次のトークンを予測
  • モデル選び=モダリティ・能力・コスト・速度・コンテキスト長のバランス(Foundryのモデルカタログ)
  • デプロイはサーバーレスAPI(手軽・従量課金)マネージド計算(専用)temperature低=堅実/高=創造的
🎯 次のステップ

※本記事はMicrosoft公式ドキュメント(生成AIのしくみ/Foundryのモデル・デプロイ/推論パラメーター)およびAI-901公式試験ガイドに基づき、エンジニアKが作成しています。製品仕様は更新されるため、最新は Microsoft公式情報 をご確認ください。

コメント

タイトルとURLをコピーしました