2026年5月10日 更新: 約 8 分で読めます

AI エージェントとは何か ── 1 往復型と連鎖型を、1 枚の図で整理する

目次
  1. 1. 「指示を出したら、あとは AI が動く」── それが何を意味するのか
  2. 2. 「1 往復型」と「連鎖型」── 使い方のパターンで整理する
  3. 3. 具体例で見る:調査エージェントは何をしているのか
  4. 例 1:調査エージェント
  5. 4. 「自分で考えて動く」の正体 ── ループと判断
  6. エージェントのループ構造
  7. 「怖い」への正直な答え
  8. 5. エージェントは LLM とどう繋がっているのか
  9. 6. 次のステップ:エージェントに「手と足」を付ける仕組み
  10. 出典・参考文献

朝、メールを開いたら、昨夜頼んでいた競合 5 社の調査結果が届いていた。価格・特徴・評判をまとめた表まである。頼んだのは自分だ。でも作ったのは AI で、夜中、誰も追加の指示を出していない。

これは近未来の話ではありません。こういう使い方はすでに始まっています。それが AI エージェント と呼ばれるものです。

「でも、ChatGPT と何が違うの?」「勝手に動くって、何を勝手にするの?」── その疑問から始めましょう。


1. 「指示を出したら、あとは AI が動く」── それが何を意味するのか

ChatGPT の普通の使い方は「あなたが指示を出す → AI が 1 回答える → またあなたが出す」という往復です。AI は受け身で、あなたが毎回の判断を担います。

ところが「AI エージェント」という言葉が指す場面は、明らかに違います。「エージェントが自律的にウェブを調べて報告書を作った」「数十のステップを経て作業を完了した」── 人間が毎回指示を出していない使い方です。

AI エージェントとは何か。一言でいえば「目標を渡すと、AI が 自分でステップを決めて、何度も動いて、結果を返してくれる仕組み 」です。

目標を渡すとAIが自分でステップを決めてループ実行し結果を返す ── AI エージェントの全体像
図 1目標を渡すとAIが自分でステップを決めてループ実行し結果を返す ── AI エージェントの全体像

もう少し正確に言うと、LLM(文章で答える AI、ChatGPT などの中身)が自分で次の手を考え、ツールを呼び出しながら複数のステップを実行し、結果を確認しつつ目標に向かってループし続けます12


2. 「1 往復型」と「連鎖型」── 使い方のパターンで整理する

AI の使い方には、大きく分けて 2 つのパターンがあります。

使い方のパターン別名動き
1 往復型質問応答型あなたが指示を出す → AI が 1 回答える → またあなたが出す
連鎖型エージェント型あなたが目標を渡す → AI が自分でステップを決めて次々に実行する

「1 往復型」 は、テキスト翻訳・メール文章作成・要約など、あなたが細かく指示を出して、AI がその都度答えを返す使い方です。ChatGPT を「質問して、答えをもらう」という形で使うとき、これが多い。

「連鎖型」 は、目標だけを渡して、途中のステップを AI に任せる使い方です。エージェントと呼ばれる仕組みはこちらです。

1 往復型では、あなたが毎回の判断を担います。「次は何を聞こう」「この答えでいいか」「次のステップは何か」── これを、人間が考えています。

連鎖型では、AI が自分でステップを決めてループします。あなたは最初に目標を渡すだけ。AI が「次に何をすべきか」を考え、実行し、結果を確認し、また次の手を考える。この繰り返しが エージェントの正体 です。

1往復型では毎ステップ人間が判断を担い、連鎖型ではAIが自律的に処理して人間は最初と最後だけ関与する
図 21往復型では毎ステップ人間が判断を担い、連鎖型ではAIが自律的に処理して人間は最初と最後だけ関与する

3. 具体例で見る:調査エージェントは何をしているのか

例 1:調査エージェント

「5 つの比較対象を調べて、価格と特徴を一覧表にして」という目標を AI エージェントに渡したとします。仕事の競合調査でも、旅行先のホテル比較でも、構造は同じです。

1 往復型なら「A を調べて」「次に B を」「これを表にして」とあなたが 6 回以上指示を出し続けます。各ステップの判断はあなたが担います。

エージェント型の場合:

  1. あなた:「5 つを調べて一覧表にして」と目標を渡す
  2. エージェントが「A を調べる」と判断 → ウェブ検索ツールを呼び出す → 結果を確認
  3. 同様に B・C・D・E と繰り返す(エージェントが自分でステップを組む)
  4. 表にまとめる手順を AI が決めて実行 → 完成した表が届く

最初に目標を渡しただけ。途中の判断はすべてエージェントが担いました。OpenAI の「Deep Research」機能はこの形式で動いており、「数百のオンライン情報源を検索・分析・統合して報告書を作成する。5 分から 30 分かけて実行される」と公式に説明されています3

最初に目標を1回渡すだけで、AIが検索・繰り返し・表作成を自律的にこなし、完成した表が届く
図 3最初に目標を1回渡すだけで、AIが検索・繰り返し・表作成を自律的にこなし、完成した表が届く

メール仕分けも、同じ仕組みで動きます。受信メールを読み込んで「緊急 / 返信不要 / 確認待ち」に分類し、緊急には返信の下書きまで作る。1 通ごとに人間が指示を出しません。Anthropic の公式資料によると、AI エージェントはメールの仕分けのような低リスクの用途から、サイバーセキュリティのような高リスクの場面まで、幅広い文脈で使われているといいます4

「自分も試してみたい」と思ったら、ChatGPT の「Tasks」機能や Claude の Projects 機能で、同じ繰り返し動作を無料で体感できます。


4. 「自分で考えて動く」の正体 ── ループと判断

エージェントのループ構造

「自分で考えて動く」の中身は、次のサイクルの繰り返しです。

  1. 計画:次に何をすべきかを LLM が推論する
  2. 実行:ツールを呼び出す(ウェブ検索・ファイル読み込み・メール送信など)
  3. 観察:ツールの結果を受け取る
  4. 評価:目標に近づいたか。次に何をすべきか。

→ 完了していなければ 1 に戻る。完了したら結果を返す。

このサイクルを繰り返す仕組みを エージェントループ(計画→実行→観察→評価のサイクル)と呼びます12

料理に例えると、こうなります。

「カレーを作って」と頼まれた料理人が、冷蔵庫を開けて食材を確認し(観察)、「じゃがいもがないから買いに行こう」と判断し(計画)、買いに行く(実行)。戻ってきたら次は何が必要かを確認する(また観察)。

これを繰り返して「完成」に至るのが、エージェントの動き方です。

エージェントは与えられた目標の範囲内で計画・実行・観察・評価のサイクルを繰り返し、完了したら結果を返す
図 4エージェントは与えられた目標の範囲内で計画・実行・観察・評価のサイクルを繰り返し、完了したら結果を返す

「怖い」への正直な答え

エージェントの説明を読んで「怖い」と感じた方へ、正面から答えます。

「仕事を奪われるのでは?」という不安も当然です。ただ、エージェントが動く範囲はあなたが渡した目標の中だけです。人間の判断や責任が消えるわけではなく、段取りの一部を引き受けてもらう形が現実に近い。

「勝手にどこまでもやってしまうのでは?」── この不安の根っこには、エージェントが目標を超えて動き回るというイメージがあると思います。

Anthropic は「自律性は固定された性質ではなく、設計と運用で決まる」と整理しています。エージェントがどこまで自分で動くかは、開発者やユーザーが設計で決めるものです4

「自律的に動く」の意味は、「与えられたゴールの外に勝手に出て行く」ではありません。 与えられたゴールの範囲内 で、次の手を AI が判断してループすることです。

設計によっては、ループの途中で人間の確認を挟むこともできます。

  • 重要な操作(ファイル削除・メール送信・決済)の前にユーザーに確認を求める
  • 最大ループ回数を設けて、上限に達したら止まる
  • 「行き詰まり」を検知したら人間に判断を委ねる

Anthropic は「エージェントはチェックポイントで一時停止し、人間のフィードバックを求めることができる」と明示しています1。OpenAI は「承認を新しいターンとしてではなく、一時停止した実行として扱う」設計を推奨しています5。つまり「AI が動きを止めて、次に進んでいいですか?と人間に確認する」設計を最初から組み込める、ということです。

エージェントは「放っておけばいい」ものではなく、動きを確認しながら任せられるものです。

ループの途中で人間の確認を挟む設計にすることで、エージェントを安全に運用できる
図 5ループの途中で人間の確認を挟む設計にすることで、エージェントを安全に運用できる

5. エージェントは LLM とどう繋がっているのか

LLM(大規模言語モデル)は「1 回の応答を返す部品」です(詳しくは「LLM の仕組み」参照)。AI エージェントとは、その LLM を複数回呼び出しながら、ツールも使いつつ、目標に向かって進む仕組み全体です。

Anthropic・OpenAI・Google の 3 社が共通して整理するエージェントの構成要素は次の 3 つです。

要素内容
LLM(モデル)次に何をすべきかを推論する頭脳
ツールAI が外界に働きかける手と足(ウェブ検索・コード実行・メール送信など)
指示エージェントの役割・制約・目標の範囲を定める設定

(3 社の公式資料より678

似た言葉で「ワークフロー」もあります。「事前に決めた手順通りに LLM を動かす仕組み」のことです。エージェントとの違いは、次の手をその場で LLM が決めるか、事前に決めておくかです。「レシピ通りに動く助手」が ワークフロー、「目標だけ渡されて段取りを自分で決めるシェフ」が エージェント です1

RAG(自分の資料を AI に読ませてから答えさせる仕組み。詳しくは「AI に教科書を渡してから聞く」参照)も、エージェントが使うツールの一つとして組み込まれます。

LLM・ツール・指示の3つが揃うことで、AIエージェントとして自律的に動く仕組みが成立する
図 6LLM・ツール・指示の3つが揃うことで、AIエージェントとして自律的に動く仕組みが成立する

エージェントはこの 3 要素(LLM・ツール・指示)が動ける土台の上で動きます。プロンプトの書き方から整理したい方には、プロンプトの書き方 ── 目的・状況・出力形式を伝えて、欲しい答えを引き出す 5 つの型が役立ちます。


6. 次のステップ:エージェントに「手と足」を付ける仕組み

エージェントは LLM だけでは何もできません。外の世界に働きかける「手と足」が必要です。その手と足がツールです。ウェブ検索・コード実行・メール送信・カレンダー更新 ── こうした外部の機能を、LLM が呼び出せる形で接続することで、エージェントは実際に行動できます。

では、AI とツールをどうやって繋ぐのか。その「繋ぎ方の取り決め(標準規格)」として、Anthropic が提案したのが MCP(Model Context Protocol) です。コンセントの差し込み口の形が統一されているように、AI とツールの接続方法を統一した仕組みだと思ってください9

MCPがAIと複数のツールを同じ接続口で繋ぎ、エージェントが外の世界を動かせる仕組み
図 7MCPがAIと複数のツールを同じ接続口で繋ぎ、エージェントが外の世界を動かせる仕組み

MCP の仕組みは別記事で整理しています:AI が外のツールを「動かせる」理由 ── MCP という接続口の話

今すぐ試すなら、ChatGPT の Deep Research や Claude のプロジェクト機能で同じ動きを体験できます。「5 社を比較してまとめて」と一言渡して、どのステップを AI が自分で決めているかを観察するのが、エージェントを体感する一番の近道です。実務への組み込み方(何を任せるか・どの場面から始めるか)は、仕事に AI を組み込む手順書で扱っています。


エージェントは「放っておけばいい機械」ではなく、目標を渡すと自分でステップを組んで動く相棒です。今日できる一歩はシンプルです。ChatGPT の Deep Research で「◯◯を 5 社比べてまとめて」と目標を渡してみる。どのステップを AI が判断しているかを見ているだけで、エージェントの動き方が体感できます。

「何を任せて、何は自分でやるか」の判断軸は「AI でできること、できないこと」で整理しています。自分の資料を読ませて使いたい場合は「AI に教科書を渡してから聞く」が参考になります。

出典・参考文献

  1. Anthropic | Building Effective Agents 2 3 4

  2. OpenAI | Agents SDK 2

  3. OpenAI | Introducing Deep Research

  4. Anthropic | Measuring Agent Autonomy 2

  5. OpenAI | Running Agents

  6. OpenAI | Define Agents

  7. Google | Agent Development Kit (ADK)

  8. Google Developers Blog | Agent Development Kit: Easy to Build Multi-Agent Applications

  9. Anthropic | Model Context Protocol

  • #AI
  • #AIエージェント
  • #入門
  • #ChatGPT