2026年5月9日更新: 2026年5月18日約 17 分で読めます

AI は会話を覚えていない ── 毎回ぜんぶ読み直している、その仕組み

田上天羽『AI帳！』を書いている人

1. 長く話していると、急に話が噛み合わなくなる
2. AI は会話を覚えていない
3. 読み返す量には上限がある ── 机の広さ
4. 机に乗っているのは、会話履歴だけではない
5. 長く話すと、古い紙が机からこぼれる
5-1. 古い紙が机からこぼれる
5-2. 机の真ん中の紙が読み飛ばされる
5-3. 全部読めるが、AI の集中力が落ちる
6. メモリ機能は “机の上の紙” ではない
7. 今日からの付き合い方
7-1. 話題が変わったら、新しい会話で始める
7-2. 長くなったら、要点を渡し直す
7-3. 何度も同じことを言うなら、メモリ機能に任せる
7-4. 長い資料は、会話に貼らずに添付で渡す
出典・参考文献

会話の冒頭で「ですます調で答えて」と頼んだ。最初の数往復はそのとおりだった。気づくと、いつもの調子に戻っている。

長文の議事録を貼って要約を頼んだら、要点のいくつかが抜け落ちていた。

「前にお伝えした A さんの件で」と続けたら、別の A さんの話を勝手に始めた。

どれも、あなたの聞き方が悪いわけではありません。AI 側の仕組みから、自然に出てくる動きです。

もう少し踏み込むと ── 私たちが「AI と話している」と感じているそのやり取りは、AI 側から見ると、実は会話ではありません。一往復ごとに、AI は最初の挨拶からあなたの今の質問までを、台本のように丸ごと読み直しているだけです。

この記事では、その「読み直している」がどう動いていて、読み直せる量に上限があるとはどういうことか。長くなると物忘れが起きるのはなぜか。そしてメモリ機能と通常の会話は何がどう違うのか ── を最初から順にたどります。

この記事全体の地図です。いま意味が分からなくても大丈夫です。読み終わったあとに戻ってくると、すっと頭に入ります。

図 1会話履歴は毎ターン丸ごと再送される、机の広さには上限がある、長くなれば紙が 3 通りにこぼれ、メモリ機能は別ノートからの転記、付き合い方は 4 通り

1. 長く話していると、急に話が噛み合わなくなる

ChatGPT、Claude、Gemini ── どのサービスを使っていても、長く話していると、こういう瞬間が来ます。

会話の最初で「ですます調で答えて」と頼んだのに、しばらくすると普段の調子に戻っている
長文の議事録を貼って要約を頼んだら、要点のいくつかが抜け落ちている
「前回の A さん」と書いたら、別の A さんの話を勝手に始めた
30 分前に決めたばかりの方針を、ほんの数往復後にまた質問し直してくる

これらをまとめて「AI が物忘れを始めた」と感じている方は、たくさんいます。

「思った答えが返ってこない」── この違和感には、実は 2 種類が混ざっています。ひとつは、頼み方の側の問題です。聞き方を変えれば、返ってくる答えは変わります。これは別記事「『欲しい答え』が返ってくる聞き方」のテーマで、ここでは扱いません。

もうひとつが、この記事のテーマです。聞き方を直しても直らない、仕組みそのものから来る物忘れ。長くなるほど起きやすく、ある瞬間から急に噛み合わなくなる。

これを解きほぐすには、AI が会話のたびに裏で何をしているかを、いちどのぞき込む必要があります。

AI の研修を担当していると、よくこんな質問が出ます。「話しかけ続けると、だんだん賢くなるんですか？」。会話を重ねるほど AI が成長する、という誤解です。この記事を最後まで読むと、その答えも自然に見えてきます。

この仕組みを知らないと、利用料金が予想外に膨らむことがあります。それも「仕組みが分かっていると避けられた」話です。

図 2思った答えが返らない違和感には 2 種類あり、仕組みの問題は聞き方を変えても直らない

2. AI は会話を覚えていない

いきなり、いちばん大事なところから出します。

AI は、あなたとの会話を覚えていません。

もう少し正確に言うと、AI そのものには、人間の脳のような「前のことを覚えておく力」がありません。あなたが「さっき話した件で」と書いたとき、AI が頭の中の思い出から該当の話を引っ張り出してくる、ということは起きていません。

代わりに、こういうことが起きています ── あなたが新しい質問を送るたびに、画面に並んでいるこれまでの会話ぜんぶが、AI に丸ごと送り直されています。最初の挨拶から、途中の細かいやり取りまで、すべてです。（厳密には、後で見る「机の広さ」に乗りきっているあいだだけ ── §5 で詳しく扱います。）

ChatGPT・Claude・Gemini のどれも、AI が裏で動いている仕組みのレベルでは、この「 毎ターン履歴ぜんぶを送り直す 」が基本です。Anthropic（Claude を作っている会社）の公式ドキュメントは、こう書いています。

“As the conversation advances through turns, each user message and assistant response accumulates within the context window. Previous turns are preserved completely.”¹ （会話が進むにつれて、ユーザーの発言と AI の応答が机の上に積み上がっていく。前のやり取りは丸ごと保たれる）

OpenAI の公式ドキュメントも、同じことを別の言い方で書いています ── AI への問い合わせはひとつひとつ独立で記憶を持たないので、過去の発言を毎回まとめて渡すことで、複数回のやり取りを成立させている、と²。

会話がつながって見えるのは、送る側のアプリ（ChatGPT のチャット画面、Claude のアプリ、Gemini のアプリ）が、毎ターン裏で履歴を丸ごと送り直しているから。それだけです。

言い換えると、画面に並んでいる「会話履歴」は、あなたに見せるための記録ではありません。AI に読ませるための台本です。新しい行を 1 つ送るたびに、台本を最初からもう一度 AI に読ませて、続きを書かせている。これが、ふだん私たちが「会話している」と感じている時間の中身です。

AI の頭の中身（学習）と、ここで言う「毎回読み直している中身」は別物です。前者の話は別記事「LLM の仕組み」で扱っています。ここでは後者だけを掘り下げます。

3. 読み返す量には上限がある ── 机の広さ

毎ターン、履歴を全部送り直す。これでなんとなく動きは見えました。けれど、ここで素朴な疑問が出てきます。

履歴がどんどん長くなっても、いつまでも全部送り直せるの？

答えは、送れません。

AI が一度に読み直せる量には、はっきりした上限があります。業界用語では コンテキストウィンドウ（直訳すると「文脈の窓」）と呼ばれますが、ここからは「机の広さ」と呼ぶことにします。机が広いほど、たくさんの紙を一度に並べられる。狭ければ、すぐにいっぱいになる。それだけのことです。

Anthropic の公式ドキュメントは、この机のことを「作業のための記憶（working memory）」と表現しています。

“The ‘context window’ refers to all the text a language model can reference when generating a response, including the response itself. This is different from the large corpus of data the language model was trained on, and instead represents a ‘working memory’ for the model.”¹ （コンテキストウィンドウとは、AI が応答を組み立てるときに参照できるテキスト全部を指す。応答そのものも含む。学習で身につけた膨大な知識とは別物で、その場の作業のための記憶を意味する）

ここで、AI の知識には 2 種類あることが、はっきりと区別できます。

頭の中身として持っている知識（学習）：膨大な量の文章を読み込んで、AI の頭の内側に書き込まれているもの
机の上に並んでいる知識（コンテキスト）：いま、まさにこの会話で AI が見ているもの

私たちが「会話している」あいだ、毎ターンやり取りされているのは、後者の「机の上の紙」だけです。

机の広さ（コンテキストウィンドウ）は、モデルによって違います。今の主要モデルだと、おおむね本数冊分（ものによっては十数冊分）── 長めの議事録なら 3〜5 枚分、会議のメモなら数十枚分といったイメージの文章を一度に並べられる広さがあります。具体的な文字数は半年単位で広くなっていくので、ここでは数値を出しません。「広いものが出てきている」と思ってください。

ただし、ここに大事な但し書きが付きます。Anthropic 自身が、同じドキュメントの中でこう警告しています。

“More context isn’t automatically better. As token count grows, accuracy and recall degrade, a phenomenon known as context rot.” （文脈は広いほど良いというものではない。扱う字数が増えるにつれて、精度や記憶力は落ちる。この現象は context rot と呼ばれている）

つまり、 机が広いほど良いわけではない 。広く並べた紙を AI がぜんぶ等しく読めるかというと、そうではない。ここから §5 の話につながります。

図 4机が広くなっても、紙が増えるほど読み落としが起きる ── これが文脈の腐敗（context rot）

4. 机に乗っているのは、会話履歴だけではない

「机の上に並ぶ紙」── ここに乗っているのは、会話の履歴だけではありません。あなたが意識せずに乗せている紙が、もう 2 種類あります。

紙の種類	中身
会話履歴	これまでのやり取り全部。最初の挨拶から、いちばん新しい質問まで
添付した資料	チャットに貼り付けた PDF、Word、画像、コードなど。「この資料を読んで」と渡したファイル
システム指示	AI への基本的な振る舞いの指示。「ですます調で答えて」のような会話冒頭の頼みごとや、サービス側が裏で混ぜている指示も含む

この 3 つが、すべて同じ机の上に並んでいます。AI から見ると、どこから来た紙かは関係なく、机の広さの上限を一緒に消費していく。

長い PDF を 1 つ貼った直後に「あ、ところで別件で」と話題を変える、ということをやってみると体感できます。AI が PDF の話に引きずられている、と感じる場面が出てきます。これは、机の上にまだ PDF の紙が広く広がっていて、新しい話の紙はその端っこに追加で置かれているからです。

「資料を渡す」と「会話履歴を続ける」は、私たちの感覚では別物に思えます。けれど AI 側から見ると、どちらも文字に変換されて机に届く、同じ仲間の紙です（長い資料は、関連する箇所だけが抜粋されてから机に届く場合もあります）。

添付資料の渡し方そのもの（チャットのファイル添付、NotebookLM、Claude の Projects、RAG（外部の検索結果を取り込んで答えさせる仕組み）のような仕組み）は、別記事「AI に教科書を渡してから聞く」で詳しく扱っています。ここで覚えておいてほしいのは ── 会話履歴も、添付資料も、システム指示も、ぜんぶ同じ机に乗る。机の広さは決まっている。

図 5会話履歴・添付資料・システム指示の 3 つは、すべて同じ机の広さを一緒に消費していく

5. 長く話すと、古い紙が机からこぼれる

これで、§1 で挙げた「物忘れ」の正体が見えてきます。話が長くなれば、机の上の紙が積み重なる。机の広さに上限がある以上、どこかで新しい紙のために古い紙を片付けることが起きます。

片付け方には、3 通りあります。それぞれ、AI 側で起きる挙動が違います。

5-1. 古い紙が机からこぼれる

もっとも単純な片付け方です。机がいっぱいになったら、いちばん古い紙から順に床に落とす。AI から見えなくなる。

長い会話を続けていて、ある時点から会話の冒頭で言ったことが反映されなくなる ── あれです。「ですます調で」と最初に頼んだ紙が、机から落ちている。AI はもう、その紙を見ていません。

Anthropic の Claude のチャット画面（claude.ai）では、机がいっぱいになったときに古い順から押し出す方式（ローリング、と呼ばれます）が使われていると、公式ドキュメントの注釈¹に書かれています。

ChatGPT や Gemini のチャット画面でも、似た挙動が裏で起きていると考えるのが妥当です。ただし各社の細かい仕様は公開されていない部分が多く、こぼれる正確なタイミングは外からは分かりません。チャット画面のこぼれ方を公式ドキュメントに書いているのは、いまのところ Anthropic だけです。

Anthropic の API には、机がいっぱいになる手前で古い会話を要約に置き換える仕組み（compaction、コンパクション）も用意されています。これだと、紙そのものは床に落とすものの、要点だけを書き出した付箋のような紙が机に残る、という延命策が打てます。

5-2. 机の真ん中の紙が読み飛ばされる

ここが、やや意外な動きです。机に紙が並んでいても、AI はすべての紙を均等に読んでいるわけではありません。冒頭の数枚と、いちばん新しい数枚にしっかり目を留めて、 真ん中の紙は読み飛ばす癖 があります。

これは 2023 年の研究で確認されました³。長い文章の中に「探してほしい情報」を置いて AI に答えさせると、答えの正確さは「最初か最後」で高く、「真ん中」で大きく落ちる ── という U 字型のクセがある、という内容です。

意外なのは、机の広さがどれだけ大きくなっても、この性質は消えていない、という点です。2025 年の追試でも、長めの文章で同じ U 字型が観察されています⁴。長い文章全般を使ったテストでも、最新モデルで「長くなるほど精度が落ちる」傾向が広く確認されています。机が広くなった分だけ、真ん中の見落とす範囲も広くなっただけ ── という冷たい現実です。

長い議事録を要約させたら真ん中の議題が抜けていた、というのは、これが効いているのかもしれません。

図 7紙の真ん中だけ読み飛ばされる U 字型のクセがあり、議事録の中盤の話が抜けるのはこれが原因

5-3. 全部読めるが、AI の集中力が落ちる

3 つめが、もっとも気づきにくい動きです。机の上に紙がぜんぶ乗っていて、こぼれてもいない。真ん中もいちおう読まれている。それでも、AI の答えの精度が落ちる。

§3 で出てきた context rot（文脈の腐敗）がこれです。Anthropic の同じドキュメントには、「広い＝良い、ではない」と明記されていました。

人間でも、机の上に資料が 3 枚あるときと、30 枚あるときでは、集中の仕方が違います。30 枚を全部読んでも、3 枚のときと同じ精度で答えを組み立てるのは難しい。AI も似た性質を持っている、と思ってください。机が広いほど、紙はたくさん並ぶけれど、AI の頭の集中力はその分だけ薄まる。

3 つを並べると、こうなります。

名前	起きていること	読者の体感
机からこぼれる	古い紙が机から押し出されて消える	「最初に頼んだことを忘れている」
真ん中が読み飛ばされる	紙はあるが、真ん中だけ読まれない	「長い資料の中盤の話が抜けている」
集中力が落ちる	紙はあって、読まれてもいる。それでも精度が落ちる	「全体としてぼんやりした答えになる」

こぼれた話、読み飛ばされた話、ぼやけた話 ── これらに対して AI が無理にでっち上げで答えてしまう現象を ハルシネーション と呼びます。詳しくは別記事「ハルシネーション ── AI に『本当』の感覚が無い、という話」で扱っています。

図 9物忘れには 3 通りある。古い紙が机から落ちる、真ん中が読み飛ばされる、全体の集中力が落ちる

6. メモリ機能は “机の上の紙” ではない

机の上の紙の話は、これで一段落です。けれど、AI を使い込んでいる方なら、こう思うかもしれません。

「ChatGPT のメモリ機能をオンにしたら、私の名前や好みを覚えてくれている。あれは机の上の紙とは違うのでは？」

そのとおりです。メモリ機能（ChatGPT の Memory、Claude の Memory・Projects、Gemini の Saved Info などと呼ばれる機能）は、机の上の紙とは別の仕組みです。

どう違うかというと ── メモリ機能は机の横にある別ノートだと思ってください。あなたが「私は犬が好き」と話したら、AI 側のシステムが「これは覚えておこう」と判断して、別ノートに書き留める。そのノートは、机の上の紙とは別の場所に保管されています。

そして、新しい会話を始めるたびに、何が起きるかというと ── 机に紙を並べる前の段階で、別ノートから要点が抜き書きされて机の冒頭にこっそり置かれます。あなたから見ると「会話を覚えている」ように感じますが、AI から見ると、毎回まっさらな机に向かって、最初に渡されたメモを読み上げてから、あなたとのやり取りに入っている、という動きです。これが 別ノートからの転記 です。

OpenAI の公式ヘルプは、この仕組みをこう書いています。

Like custom instructions, saved memories are part of the context ChatGPT uses to generate a response.⁵ （saved memories は、custom instructions と同じく、ChatGPT が応答を組み立てるときに使う「コンテキスト（机の上）の一部に含まれる」）

「コンテキスト（机の上）の一部に含まれる」── つまり机に乗る、ということです。ただし、それは会話履歴とは別の場所に保管されたものが机に転記されてくる形になっています。

OpenAI 自身が、保管場所を「メモ帳（notepad）」と呼び、会話履歴とは別物だと明記しています。原文では「The ‘notepad’ of your saved memories are stored separately from your chat history.」── 意訳すると「あなたの記憶は、会話の履歴とは別の場所にあるメモ帳に保管されている」です。

各社の同種の機能を、動詞ベースで並べると、こうなります。

サービス	呼び方	実際の動き
ChatGPT	Memory（saved memories ／ chat history reference）	ユーザーの好みや基本情報を別ノートに溜め、次の会話の冒頭に転記
Claude	Memory ／ Projects	過去の会話から自動で要点を要約して別ノートに溜め、新しい会話の冒頭に転記。Projects ごとに別のノートを持つ
Gemini	Saved Info ／ Personal Context	ユーザーの基本情報や対話の好みを別ノートに溜め、次の会話の冒頭に転記

たとえば Claude の Memory は、過去のあなたの会話を 24 時間ごとに要約し直して、新しい会話の冒頭にその要約を読ませる、という動きを公式に説明しています⁶。Memory は 2026 年 3 月以降、無料プランを含めた全ユーザーで使えます。

細かい仕様や UI の場所、機能の正式名称は半年単位で変わります。ただし、「会話の机に乗る紙ではなく、別ノートからの転記である」という共通の構造は、各社で大きくは変わっていません。

以下は API・開発者向けの話なので、ChatGPT や Claude を普通に使う分には飛ばして大丈夫です。

Anthropic は 2025 年に、もう一段先の仕組み ── 記憶ツール（memory tool）を発表しました。これは、メモ帳どころか会話の外にファイリングキャビネットを置いて、必要な書類だけ机に取り寄せる仕組みです。Anthropic 自身が「机の外で情報を保管・参照する（store and consult information outside the context window）」と書いています⁷。机の上の紙でも別ノートでもなく、外部の書庫です。

整理すると、AI が見ている情報は 3 段になります。

机の上の紙：いまの会話。会話履歴・添付資料・システム指示
横の別ノート：会話をまたいで残る基本情報。ChatGPT の Memory、Claude の Memory・Projects、Gemini の Saved Info など
外のファイリングキャビネット：会話の外に保管して、必要な書類だけ取り寄せる。Anthropic の記憶ツール（API 向け）など

「AI が記憶している」と感じる場面のうち、ほとんどは机の上の紙か、別ノートからの転記です。AI 自体の頭の中身は、毎回まっさらに近い状態に戻っている、と思ってください。

図 10AI が記憶していると感じる中身のほとんどは、机の上の紙か、別ノートからの転記。外のキャビネットからの取り寄せは開発者向けの別仕組み

7. 今日からの付き合い方

§5 で見た 3 種類のこぼれ方（机から落ちる・真ん中が読み飛ばされる・集中力が落ちる）それぞれに対する手順を、以下に整理します。

仕組みが見えた以上、付き合い方も変わってきます。手元ですぐ試せる 4 つを並べます。

7-1. 話題が変わったら、新しい会話で始める

同じ会話を引きずり続けると、机の上の紙が増えていき、§5 で見たどれかのこぼれ方が起きます。話題がガラリと変わるなら、新しい会話を開くのがいちばん素直な対処です。古い机を片付けて、まっさらの机で始める、ということ。

「前の話の続きで、〇〇したい」のような、同じ話題の中の枝分かれなら、そのまま続けてかまいません。けれど、「次は別件で」「ちょっと話を変えて」と思ったときは、新しく開く。それだけで、机はまっさらに戻ります。

7-2. 長くなったら、要点を渡し直す

同じ話題の中でも、やり取りが長く続くと、最初に言った前提が机からこぼれかけます。そういうときは、自分で要点を 5〜10 行にまとめて、改めて AI に渡し直す。

ここまでの整理：私は〇〇を、〇〇のために考えていて、いまは〇〇の段階です。次に〇〇を聞きたいです。

このような形で、机に小さな付箋を 1 枚貼り直す感覚です。Anthropic の機械要約（compaction）の人間版を、自分の手でやる、と思ってください。

7-3. 何度も同じことを言うなら、メモリ機能に任せる

「私は経理の仕事をしている」「数学の問題は解き方も一緒に教えて」「町内会の役員をしている」「文章はです・ます調で」── こうした情報は、メモリ機能（ChatGPT の Memory、Claude の Memory・Projects、Gemini の Saved Info）に書いておくと、毎回の冒頭で自動的に机に転記されます。

ただし、メモリ機能はあくまで基本情報のメモ帳です。複雑な作業の手順や、長い専門資料はここに書かないでください。机の上の紙が太ってしまい、§5 の物忘れが早く来ます。

7-4. 長い資料は、会話に貼らずに添付で渡す

議事録、取扱説明書、長文の規約 ── こうした資料を会話本文に直接貼り付けると、机の半分以上をその紙が占めます。代わりに、以下の 2 つの渡し方を使ってください。

チャットのファイル添付：いまの会話のあいだだけ AI に資料を読ませる。ChatGPT・Claude・Gemini のどれにも、入力欄からファイルを渡す機能があります
資料を常駐させる専用サービス：複数の会話で同じ資料を使い回せるように置いておく。NotebookLM、Claude の Projects、ChatGPT の GPTs など

資料を別の渡し方で読ませると、机を圧迫せずに済む。会話本文に直接貼るのは最後の手段です。

詳しくは別記事「AI に教科書を渡してから聞く」で扱っています。

これは利用料金にも直結します。従量課金制の AI サービスでは、毎ターン机に乗っている量のぶんだけコストが発生する仕組みです。同じチャットでずっと使い続けると、履歴が肥大して毎回の読み直しコストが膨らんでいく。研修を通じて知り合った担当者から「特定の利用者が同じチャットを長時間使い続けていて、月の利用料金が跳ね上がった」という話を聞いたことがあります。利用者本人は気づいておらず、担当者からこっそり注意が入ったケースです。話題が変わったら新しい会話を開く ── これは気分の問題ではなく、コスト管理の実践でもあります。

図 13机の広さに合わせて、紙の置き方を選ぶ ── 新規会話で始める、要点を渡し直す、メモリ機能に任せる、添付で渡す

仕組みが見えると、AI との付き合い方は変わります。「物忘れする AI」と諦めて短く切り上げるのでも、「全部覚えていてほしい」と過剰に期待するのでもなく、机の広さに合わせて、紙の置き方を選ぶ ── このひと手間で、噛み合わなさの大半は減ります。

AI でできることの全体像を地図として整理したい場合は、別記事「AI でできること、できないこと ── 仕組みで整理する「地図」」が出発点になります。

AI を本格的に使い込んでいくと、机の上に何を置くか、外のキャビネットに何を逃がすかを、きめ細かく設計する場面が出てきます。「机の使い方が上達した人が次に向かう話」── この記事は、そこに進む前の足場です。

出典・参考文献

#AI
#LLM
#コンテキスト
#仕組み
#入門