2026年5月8日 更新: 約 12 分で読めます

AI・機械学習・深層学習・生成 AI の違い ── 入れ子で見ると、ニュースが読める

目次
  1. 1. 7 つの言葉の関係を、入れ子でほどいていく
  2. 2. いちばん外側の袋 ──「AI(人工知能)」
  3. AI の袋には、機械学習以外も入っている
  4. 3. 中の袋 ──「機械学習」(コンピュータが自分でルールを覚える)
  5. 機械学習の中にも、いくつかの種類がある
  6. 4. さらに中 ──「ディープラーニング(深層学習)」── 脳をまねた機械学習
  7. 2012 年、世界が変わった
  8. ただし、機械学習がすべてディープラーニングではない
  9. 5. もっと中 ──「生成 AI」── 作る側の AI
  10. 「作る AI」と「当てる AI」
  11. 生成 AI ブームの始まり
  12. 「ほぼすべて」が深層学習製
  13. 6. いちばん奥の人形たち ──「LLM・画像生成 AI・音声/動画生成 AI」
  14. LLM ── 文章を作る生成 AI
  15. 画像生成 AI ── 絵を作る生成 AI
  16. 音声・音楽生成 AI
  17. 動画生成 AI
  18. ChatGPT は「LLM」そのものではない
  19. 7. 全体図 ── 入れ子で読み直す
  20. 実例で位置を確認する
  21. この後どこへ進むか

AI、生成 AI、機械学習、ディープラーニング、LLM(大規模言語モデル)、画像生成 AI、ChatGPT。

ニュースを開けば、毎日のようにこれらの言葉が並びます。会話でも飛び交います。けれど、頭の中でこれらがどうつながっているか、改めて見直すと一瞬詰まる。「全部 AI のこと」と答える方も、「これは別もの」と答える方も、両方が同じくらい正しく、同じくらい不正確です。

実はこれらの言葉は、 入れ子の人形 ── ロシアのマトリョーシカのように、外に大きい袋、中に小さな袋、という関係でつながっています。一度ほどいてしまえば、ニュースでどの言葉が出てきても「これはこの袋の話だな」と地図のうえに置けるようになります。

仕事で AI を使い始めたい方にも、ニュースを正確に読みたい方にも、この入れ子の地図は手元に置いておく価値があります。

この記事は、その地図を一枚作ります。


1. 7 つの言葉の関係を、入れ子でほどいていく

冒頭に並べた 7 つの言葉には、外から中へ向かう順番があります。

一番大きい袋に「AI」が入ります。AI の袋を開けると、中に「機械学習」という少し小さい袋。機械学習を開けると「ディープラーニング(深層学習)」、それを開けると「生成 AI」。さらにその奥に、「LLM」「画像生成 AI」「音声・動画生成 AI」といった人形が並んでいる ── という具合です。

外から中に向かうにつれて、専門的な言葉に絞り込まれていきます。逆に言えば、奥にある言葉は、それより外側のすべての袋にも入っています。ChatGPT は LLM の中の一つの製品ですが、同時に「生成 AI でもあり、深層学習でもあり、機械学習でもあり、AI でもある」のです。

この記事では、外側の袋から順に、一つずつ開けていきます。

AI から最内の LLM・画像生成・音声/動画まで、外から内へ階層が深まるほど専門的な言葉になる
図 1AI から最内の LLM・画像生成・音声/動画まで、外から内へ階層が深まるほど専門的な言葉になる

2. いちばん外側の袋 ──「AI(人工知能)」

一番外側の袋は「AI(人工知能、Artificial Intelligence)」です。

AI とは、ざっくり言えば 「人間の頭の仕事をコンピュータにさせる試み全般」 を指します。文章を読む、絵を描く、判断する、答える ── 人間がやっていた頭の仕事を機械にやらせよう、という発想全部が、この一番大きな袋に入ります。

「AI」は新しい言葉ではありません。1955 年、アメリカのダートマス大学のジョン・マッカーシーら 4 人が、翌年の研究会議に向けた提案書で初めてこの言葉を使いました。会議は 1956 年夏に実際に開かれ、これが AI 研究の出発点とされています。半世紀以上の歴史がある、古い用語です。

つまり、AI = ChatGPT ではありません。ChatGPT は、AI という長い歴史の中で、ごく最近(2022 年)登場した一つの製品にすぎません。

AI の袋には、機械学習以外も入っている

AI の袋の中には、後で出てくる「機械学習」以外にも、人がルールを書き込んだ古いタイプの AI が含まれます。「もし○○なら××する」という条件分岐を、人間の専門家が一つずつ書き込んだ仕組みです。ルールベース AI や エキスパートシステム(専門家の判断ルールをプログラムした仕組み)と呼ばれます。

身近な例を挙げると、初代の将棋ソフト、税務ソフトの判定処理、迷惑メールの簡単なフィルタ(「件名に『当選』が含まれていたら迷惑」のようなルール)── こうした「決まった通りに動く」AI も、立派に AI の袋の中にあります。

ニュースで「AI」と聞くと、2010 年代以降の話題はほとんどが次の章で出てくる「機械学習」の話です。けれど厳密には、それより外側にある古いタイプの AI も、AI という言葉の傘の中にあります。「AI なら全部、データから学んでいるはず」と思い込まないでください。

AI の袋には機械学習以外に、人がルールを書いたルールベース AI も含まれる
図 2AI の袋には機械学習以外に、人がルールを書いたルールベース AI も含まれる

3. 中の袋 ──「機械学習」(コンピュータが自分でルールを覚える)

AI の袋を開けると、中に「機械学習(Machine Learning, ML)」という袋があります。

「機械学習」は、AI という言葉より一段、親しみにくい。文系も含む大学生に AI を説明するとき、この言葉で止まる場面が一番多い。中身の例を出しても「見たことも聞いたこともない技術ばかり」という感想になりがち ── それが「機械学習 = 難しい」という印象を作ります。

機械学習は、AI の中の一つの手法です。何が違うかというと、 ルールを誰が用意するか です。料理にたとえると、こんな対比です。

  • 古いタイプの AI ── 人がレシピを書き、機械はその通りに作る
  • 機械学習 ── 「うまくできた料理」「失敗した料理」を大量に見せて、機械に味の決め手を覚えさせる

例えば、迷惑メール判定。古いタイプなら「『当選』『無料』『今すぐ』が含まれていたら迷惑」と人間がルールを書きます。機械学習なら、過去の「迷惑メールだった」「迷惑メールではなかった」というデータを大量に与えて、何が迷惑メールっぽい特徴かをコンピュータ自身に見つけ出させます。

古いタイプの AI は人がレシピを書き、機械学習はデータから自分で味の決め手を覚える
図 3古いタイプの AI は人がレシピを書き、機械学習はデータから自分で味の決め手を覚える

身近な例はたくさんあります。

  • スマホで撮った写真を「人物」「風景」「料理」に自動分類する機能
  • YouTube やネットスーパーの「おすすめ」
  • クレジットカード会社の不正利用検知
  • スマートスピーカーや音声入力の音声認識

これらはすべて、機械学習が裏で動いています。

機械学習の中にも、いくつかの種類がある

今すぐ AI を使いたい場合、この層を深く知らなくても大丈夫です。機械学習は「裏で動いている仕組み」として意識せずに使えます。

機械学習には大きく 3 つの種類があります。

  • 教師あり学習 ── 「これは犬、これは猫」と正解を付けたデータから学ぶ。正解を見せてもらえる勉強
  • 教師なし学習 ── 答えのないデータから、自分でパターンを見つける。先生のいない自習に近い
  • 強化学習 ── ご褒美と罰を頼りに試行錯誤しながら上達する。囲碁で人間を超えた AlphaGo(アルファ碁)や、ロボットが歩き方を覚える研究はこれが中心です
機械学習には正解付きの勉強・先生のいない自習・しつけや訓練に似た 3 つの学び方がある
図 4機械学習には正解付きの勉強・先生のいない自習・しつけや訓練に似た 3 つの学び方がある

4. さらに中 ──「ディープラーニング(深層学習)」── 脳をまねた機械学習

機械学習の袋を開けると、中に「ディープラーニング(深層学習、Deep Learning)」という袋があります。

ディープラーニングは、機械学習の中の、「ニューラルネットワーク」という仕組みを使った一手法です。

ニューラルネットワークは、人間の脳の神経細胞のつながりを真似た、コンピュータの中の仕組みです。脳の中で神経細胞が信号を受け渡しするように、コンピュータの中で「層(レイヤー)」が並び、入力された情報を次の層へ、また次の層へと渡しながら答えを作ります。

「ディープ(深い)」は、この層がたくさん重なっていることを意味します。層が多いほど、複雑なパターンを捉えられるようになります。

層が深いほど複雑なパターンを捉えられる、脳をまねたコンピュータの仕組み
図 5層が深いほど複雑なパターンを捉えられる、脳をまねたコンピュータの仕組み

2012 年、世界が変わった

ディープラーニングが世界の景色を変えたのは、 2012 年 です。

その年、ジェフリー・ヒントン教授のチームが、画像認識の年次競技会に深層学習を使って参加しました。結果は圧勝でした。前年のエラー率を一気に半分近く下げ、「これは歴史の転換点だ」と研究者たちが評したほどです。

ここから、画像認識・音声認識・自動運転・自動翻訳など、「コンピュータには無理だろう」と思われていた仕事のほとんどに、ディープラーニングが使われるようになりました。あなたのスマホの顔認証も、写真の自動補正も、音声入力の精度も、ほぼディープラーニング製です。

ヒントン氏ら 3 人は、2018 年、コンピュータ界のノーベル賞と呼ばれる「チューリング賞」を受賞しました。残る 1 人はモントリオール大学のヨシュア・ベンジオ氏です。「ディープラーニングの父」と呼ばれる人たちです。

2012 年の ImageNet 圧勝から 2018 年チューリング賞を経て、深層学習は今のスマホにまで溶け込んだ
図 62012 年の ImageNet 圧勝から 2018 年チューリング賞を経て、深層学習は今のスマホにまで溶け込んだ

ただし、機械学習がすべてディープラーニングではない

念のため添えると、機械学習がすべてディープラーニングというわけではありません。ディープラーニング以外にも様々な統計的手法があります。「軽くて実装が速い」「データが少なくても動く」「結果の根拠を説明しやすい」といった強みがあるため、2026 年時点でも現役で使われています。

身近なものでは、迷惑メール判定の一部、Excel の予測機能、簡単な売上予測などは、ディープラーニング以外の機械学習で動いていることも多いです。「最近の AI は全部ディープラーニング」とまで言ってしまうと、半分くらい嘘になります。

ディープラーニングも、使う側は意識しなくて構いません。スマホや各種サービスに組み込まれており、自分で選んで使うものではないからです。

機械学習の中にはディープラーニング以外の手法も現役で、迷惑メール判定や売上予測に使われている
図 7機械学習の中にはディープラーニング以外の手法も現役で、迷惑メール判定や売上予測に使われている

5. もっと中 ──「生成 AI」── 作る側の AI

ディープラーニングの袋を開けると、その応用の中に「生成 AI(Generative AI)」という袋があります。

生成 AI は、文字通り 「新しいものを作る AI」 です。文章、絵、音声、音楽、動画、プログラムのコード ── 出力が「学んだデータの中には無かった、新しく作られたもの」になるのが特徴です。

「作る AI」と「当てる AI」

ここで、生成 AI と対比される「判別 AI(Discriminative AI)」という言葉も覚えておくと、地図がぐっと立体的になります。役割でいえば、 判別 AI は審査員、生成 AI は作り手 です。

  • 判別 AI ── 入ってきたものが何か当てる。スパム判定、顔認証、医療画像から病変を見つける ── 「これは A か、B か、C か」を答える側
  • 生成 AI ── 指示を受けて新しいものを作る。文章を書く、絵を描く、声を作る ── 「こういうもの作って」と頼まれる側
判別 AI は何か当てる審査員、生成 AI は新しく作る作り手
図 8判別 AI は何か当てる審査員、生成 AI は新しく作る作り手

判別 AI は、生成 AI ブームよりずっと前から実用化されていました。スマホの顔認証、写真の人物自動仕分け、銀行の不正検知 ── これらは判別 AI です。「AI = 何かを作るもの」と思い込まないでください。

生成 AI ブームの始まり

生成 AI の技術自体は、2010 年代から研究されていました。けれど、一般の人が触れる形で広まったのは 2022 年です。

  • 2022 年 8 月 ── Stable Diffusion が公開され、誰でも自分のパソコンで画像を生成できるようになりました
  • 2022 年 11 月 30 日 ── ChatGPT が公開され、たった 2 ヶ月で 1 億人のユーザーを集めました ── 当時としては前例のないスピードでした
2022 年 8 月の Stable Diffusion と 11 月 30 日の ChatGPT 公開が、生成 AI ブームの起点になった
図 92022 年 8 月の Stable Diffusion と 11 月 30 日の ChatGPT 公開が、生成 AI ブームの起点になった

この 2 つが、現在の「生成 AI ブーム」の始まりです。

「ほぼすべて」が深層学習製

「生成 AI」という言葉は、厳密には深層学習が登場する前から学術用語として存在しており、専門現場では別の手法も使われています。ただし、あなたがニュースや日常で出会う「生成 AI」── ChatGPT、Midjourney、Suno、Veo ── は、ほぼすべて深層学習で動いています。以下の説明も、「生成 AI = 深層学習の応用」として読んでください。

日常で出会う生成 AI はほぼすべて深層学習製、古典手法の生成 AI は専門現場のごく一部
図 10日常で出会う生成 AI はほぼすべて深層学習製、古典手法の生成 AI は専門現場のごく一部

6. いちばん奥の人形たち ──「LLM・画像生成 AI・音声/動画生成 AI」

生成 AI の袋を開けると、ここで初めて並列に並んだ複数の人形が入っています。

これまでは「外の袋を開けたら、中に 1 つの内側の袋がある」という入れ子でしたが、生成 AI の中身は、扱う対象(文章か、絵か、音か、動画か)によって、いくつかの分野に分かれます。

以下に挙げる製品名は 2026 年時点の代表例です。AI 業界はモデルや製品が頻繁に入れ替わるため、今後別の名前が出てきても入れ子の位置は変わらないことを意識して読んでください。

LLM ── 文章を作る生成 AI

LLM(Large Language Model、大規模言語モデル)は、 文章を扱う生成 AI です。

代表的な製品(2026 年時点):

  • ChatGPT(OpenAI)
  • Claude(Anthropic)
  • Gemini(Google)

仕組みの核は 「次に来る単語を予測する」 を繰り返すこと。あなたが話しかけると、その続きとしてもっとも自然な単語を、確率の高い候補の中から 1 つ選んで返す ── これを文末まで延々と繰り返しています。詳しい仕組みは別記事「LLM の仕組み」で扱います。

LLM はあなたの入力の続きとして、次に来る単語を確率で選びながら文末まで繰り返す
図 11LLM はあなたの入力の続きとして、次に来る単語を確率で選びながら文末まで繰り返す

画像生成 AI ── 絵を作る生成 AI

画像生成 AI は、LLM とは別の仕組みで動きます。主流は「拡散モデル(Diffusion Model)」と呼ばれる方式です。ざっくり言えば、ぼやけた砂嵐のような絵から、少しずつノイズを取り除いて、頼まれた絵を浮かび上がらせる ── そういう動き方です。

代表的な製品(2026 年時点):

  • ChatGPT に内蔵された画像生成機能 ── チャット画面からそのまま使える
  • Gemini に内蔵された画像生成機能 ── 同様にチャットから使える
  • Canva AI ── デザインツールに組み込まれた画像生成
  • プロ向けには Midjourney(品質の作り込みに強い)や Stable Diffusion(自分のパソコンで動かせるオープンな仕組み)なども
同じ生成 AI でも、LLM は次の単語を予測し、画像生成 AI は砂嵐から絵を取り出す ── 中の仕組みは別系統
図 12同じ生成 AI でも、LLM は次の単語を予測し、画像生成 AI は砂嵐から絵を取り出す ── 中の仕組みは別系統

音声・音楽生成 AI

代表的な製品(2026 年時点):

  • ElevenLabs ── 人の声に近い音声合成
  • Suno、Udio ── 歌入りの音楽を作る
音声・音楽生成 AI は声を作るものと音楽を作るものの 2 系統に分かれる
図 13音声・音楽生成 AI は声を作るものと音楽を作るものの 2 系統に分かれる

動画生成 AI

代表的な製品(2026 年時点):

  • Veo(Google)
  • Kling(Kuaishou)
  • Runway ── プロ向けの細かい制御に強い
  • Pika、Luma Dream Machine、Seedance など
生成 AI は文章・画像・音声/音楽・動画の 4 分野に並列で分かれる
図 14生成 AI は文章・画像・音声/音楽・動画の 4 分野に並列で分かれる

ChatGPT は「LLM」そのものではない

ChatGPT は LLM そのものではありません。LLM の上に作られた、対話用のアプリケーション(製品)です。比喩で言えば、 LLM はエンジン、ChatGPT はそのエンジンを積んだ車 にあたります。

あなたが触れる ChatGPT は車、その中で動く LLM はエンジン ── 製品とモデル本体は別もの
図 15あなたが触れる ChatGPT は車、その中で動く LLM はエンジン ── 製品とモデル本体は別もの

同じことが Claude、Gemini にも言えます。

製品(あなたが触れる側)中で動くモデル本体(LLM)提供元
ChatGPTGPT 系列OpenAI
ClaudeClaude モデル系列(Opus / Sonnet / Haiku)Anthropic
GeminiGemini モデル系列Google

ニュースで「GPT-5 がリリースされた」と聞いたら、それは車(ChatGPT)に積んでいるエンジン本体(GPT モデル)が新しくなったという話です。車の名前は変わらず、エンジンが入れ替わった ── そういう景色を思い浮かべてください。

今すぐ AI を使い始めたいなら、ChatGPT・Claude・Gemini のような LLM から触るのが一番の近道です。機械学習やディープラーニングの知識がなくても、すぐ使えます。


7. 全体図 ── 入れ子で読み直す

ニュースで聞いた言葉を地図に置けば、その話題がどの袋の話か瞬時に分かる
図 16ニュースで聞いた言葉を地図に置けば、その話題がどの袋の話か瞬時に分かる

外から中へ:

  1. AI ── 人間の頭の仕事をコンピュータにさせる全般
  2. 機械学習 ── データから自分でルールを学ぶ AI
  3. ディープラーニング(深層学習) ── ニューラルネットワークを使う機械学習
  4. 生成 AI ── 新しいものを作る側(深層学習の応用)
  5. LLM・画像生成 AI・音声/動画生成 AI ── 扱う対象で分かれる、生成 AI の分野たち

実例で位置を確認する

ニュースや会話で出てくる言葉を、地図のどこに置くか試してみましょう。

  • 「機械学習エンジニアの求人」 → §3 の機械学習の袋全体を扱う仕事です。深層学習だけでなく、それ以外の手法も含みます
  • 「生成 AI の規制法案」 → §5 の生成 AI の袋に絞った話です。判別 AI(顔認証など)は別の議論になります
  • 「Stable Diffusion って LLM?」 → いいえ。§6 の中で、LLM と並列の別の人形(画像生成 AI、しかも拡散モデル系)です
  • 「ディープラーニングを学びたい」 → §4 の袋を中心に、§3 の機械学習も視野に入れる必要があります
  • 「AlphaGo は AI?」 → はい。AI の袋に入りつつ、機械学習の中の強化学習という枝にあります(§3)
  • 「自動運転は AI?」 → はい。判別 AI(カメラからの物体検出)と、機械学習(行動予測)が組み合わさって動いています
入れ子の各層と代表サービス、混同しやすい点・最新動向まで 1 枚で見渡す
図 17入れ子の各層と代表サービス、混同しやすい点・最新動向まで 1 枚で見渡す

この後どこへ進むか

地図ができたら、次は中身を覗きに行ってください。

「どれを先に読めばいい?」という方へ ── 仕事や日常で AI を使いたいなら まず「できること・できないこと」へ。仕組みをもっと深く知りたいなら 「LLM の仕組み」へ。ChatGPT・Claude・Gemini のどれを選ぶか迷っているなら 「3 つの違い」へ。

分かることが、怖さを減らす最初の一歩です。言葉が分かれば、ニュースが読めます。AI に何かを頼むとき、相手がどの袋の何なのかが分かれば、頼み方も選び方も変わります。

  • #AI
  • #入門
  • #用語
  • #機械学習
  • #生成AI