Chapter 15: 生成AI とは

15.1 AI / 機械学習 / 深層学習の違い

「AI（人工知能）」「機械学習」「深層学習」「生成AI」という言葉は混同されがちですが、それぞれ異なる概念です。

現在、開発現場で使われる「AI」の多くは LLM を使った生成AI を指しています。

LLM がどのようにして「文章を生成する」のか、その基本的な流れを理解しておきましょう。

重要なポイント:

トークン化: LLM はテキストをそのまま処理するのではなく、「トークン」と呼ばれる単位（単語・サブワード・文字など）に分割します。英語で「1単語 ≈ 1〜2トークン」、日本語では「1文字 ≈ 1〜2トークン」が目安です
確率的な予測: LLM は次に来るトークンを「確率」で予測します。「最も自然な続き」を出力しようとするため、同じ入力でも毎回わずかに異なる出力が生まれます
文脈の理解: Transformer という仕組みにより、文章の前後関係（文脈）を考慮して推論できます。これが LLM の強みです

現在、主要な LLM サービスは3つです。業務での利用時にどれを選ぶか判断できるよう、特徴を把握しておきましょう。

モデル	提供元	主なサービス	特徴
GPT-4o / o1	OpenAI	ChatGPT	汎用性が高く、日本語も高品質。最も利用者が多い
Claude 3.5 / 3.7	Anthropic	Claude.ai	長文・コード処理が得意。安全性への配慮が厚い
Gemini 1.5 / 2.0	Google	Gemini	Google サービスとの連携が強み。マルチモーダル対応

選択の目安:

TODO: あとで実際のスクリーンショットに置き換え - ChatGPT、Claude.ai、Gemini のトップページのスクリーンショット比較

LLM は非常に高機能ですが、万能ではありません。正しく理解して使いましょう。

できること（得意なこと）:

できないこと（苦手なこと）:

コンテキストウィンドウとは、LLM が一度の会話で処理できるテキストの最大量です。トークン数で表されます。

実用的な目安:

コンテキストが重要な理由:

コンテキストウィンドウの上限を意識しながら、必要な情報だけを絞り込んで渡す習慣をつけましょう。