-->
#20_04 | AIが急に重くなるときの運用設計
Series : AI Structural Analysis DesignNote / E&Rs inc. #23の受け:詳細ページ

#20_04|AIが急に重たくなるときの運用設計

#23では「なぜAIが急に重くなるのか」を構造で示しました。
ここでは、その構造を“実務で壊れない形”に落とします。
対策は再読み込みではありません。運用設計です。

design20_04|Receiver(#23の受け)

0|#23の結論(前提)

AIが急に重たくなる主因は、ほぼこれです。
計算負荷の増大 + ブラウザ側メモリ圧迫

モデル側(構造)

会話履歴が伸びるほど、Self-Attentionの参照範囲が増えます。
さらに巨大contextではKV cacheが肥大化し、データ転送が律速になる局面も出ます。

ブラウザ側(物理)

Chromeはタブを長時間保持すると、履歴・キャッシュ・拡張機能の影響が積み上がります。
その結果、タブ自体が“物理的に”重くなります。

※このページは「原因説明」ではなく、「壊れない運用の置き方」を目的にしています。

1|最短で効く:5つの運用ルール

時間がない人はここだけ実装してください。これが“運用設計の最小セット”です。

  1. 1スレッド=1目的。 戦略・コード・UI・画像を同居させない。
  2. 固定したら分岐。 形が見えたら保存し、新スレッドで続ける(Freeze → Fork)。
  3. 履歴を捨て、差分で渡す。 「現状+diff」だけをAIに渡す。
  4. ブラウザ再起動は“予定”で行う。 重くなってからでは遅い。
  5. 復旧はフローで行う。 リロード連打ではなく、最短手順で戻す。

2|“重くなる”典型パターン

重くなるのは「運が悪い」からではありません。
だいたい、同じパターンで起きます。

パターンA|ソースコード応酬(Ping-Pong)

  • 長いHTML/JS/CSSを貼って、微修正を何度も繰り返す
  • 履歴が“差分ログ”として肥大化し、参照負荷が増える

対策:diff運用(必要な差分だけ渡す)+ スレッド分岐(一定量で切り替える)

パターンB|UI開発応酬(見た目調整の連鎖)

  • フォント、余白、色、配置を“その場で”詰め続ける
  • 結果、会話が長期化し、ブラウザもAIも同時に重くなる

対策:一旦固定チェックリスト確認次スレッドで微調整

パターンC|戦略+実装+画像を同一セッションに詰め込む

  • 戦略議論しながらコードも触り、画像も作る
  • 制約が増え続け、AIが“保持すべき前提”を抱え込みすぎる

対策:役割で分割(Plan / Build / Verify / Publish)

3|セッション設計(分割の型)

ここが本質です。
「切る」のではなく「構造を置く」。

Type 1|PLAN(整理)

目的、制約、完成条件だけ。
コードは貼らない。スレッドを短く保つ。

Type 2|BUILD(実装)

実装だけ。
ベースファイル+差分要求で動かす。

Type 3|VERIFY(検証)

動作確認、コンソール、チェック項目。
“証拠”を残す。

Type 4|PUBLISH(公開)

OGP、リンク、SNS文、更新履歴。
出す作業だけに閉じる。

合図:
「説明が長くなってきた」「過去の前提を何度も参照している」
これが出たら、Freeze → Fork のタイミングです。

4|引き継ぎ(新チャット移行)

スレッドが重くなったと感じたら、それは「思考の分岐点」です。
迷わず現在の状態を凍結(Freeze)し、新しいスレッドへ移行(Fork)します。

移行のトリガー

  • 出力の物理的な遅延:プレビュー生成が30秒を超えた、明らかに重たいと感じる。
  • 直前のやり取りの無視:さっき合意したはずの「CSS変数」や「構造上の制約」を無視した回答が返り始めた。
  • 修正ループの発生:同じエラーを指摘しても、古いコードを使い回して改善が見られない。

新スレッドに持っていくもの

  • 最新の全文コード:「diff運用」を適用した後の最終結果。
  • 現在の到達点:「何が実装済み」で「何が未完了」か。
  • 構造上の制約:デザイン規約や、絶対に崩してはいけないロジックの前提。

運用設計の要諦:
新スレッドの冒頭で「これまでの経緯を要約して」と頼むのは禁止。自身が「ここからこれをやる」と定義した、最もクリーンなコードだけを渡すのが最短ルート。

4.1|実践:移行フロー

「重さ」を感じてから、新スレッドで開発を再開するまでの最短3ステップ。

1. 現状のFreeze(固定)

今のスレッドで「最新の全文コード」を出力させ、手元に保存。これが唯一の正解(Source of Truth)となる。

2. 文脈の抽出

「次に着手する1点」と、それを実現するために「崩してはいけない制約」だけを箇条書きで抜き出す。

3. 新スレッドでのFork

新しいチャットを立ち上げ、STEP1のコードとSTEP2の要件だけを投入。「ここから再開」と宣言する。

【投入プロンプト例】 以下は設計確定済みの最新ソースです。 これまでの経緯は無視し、このコードをベースに「●●の実装」から再開してください。

5|プロンプト設計(diff運用)

“全文貼り直し”は、重くなる最短ルートです。
AIには「現状+差分(diff)」だけを渡すのが鉄則です。

差分運用のメリット

  • 履歴の肥大化防止:AIが保持するコンテキスト(KV cache)を節約し、回答速度を維持します。
  • 精度の向上:修正範囲を限定することで、意図しない場所の勝手な書き換えやデグレードを防ぎます。

コード応酬の引き際

  • 修正が3往復を超えたら、一旦固定(Freeze)します。
  • 全文を保存し、新スレッドへ移行(4.1のフローへ)してください。

5.1|実践:diff指示テンプレ

AIに「どこを、どう変えるか」だけを出力させるための、最小限の入力セットです。

【現状】 - ファイル名:design20_04.html - 既存構造:header/footer/GAは維持 - 問題:Archiveブロックが上書きできない/タグ重複が起きる 【要求】 - 置換対象:Archiveブロックのみ - 追加禁止:新しい<main>タグを作らない - 出力:置換後のブロック全文(そのままコピペ可能な形式)

運用設計のコツ:
「全部書き直して」ではなく「このブロックだけ置換して」とターゲットを絞り込むことが、ブラウザのフリッカーを防ぐ最大の防御策になります。

5.2|ブラウザ設計(Chromeメモリ)

AI側だけを疑うと、復旧が遅れます。
ブラウザ側の“物理限界”を運用設計に入れてください。

実戦:描画トラブル・フリッカー対策
画面の点滅や操作不能は、GPUプロセスの限界サインです。以下の物理リセットを試してください。
1. Shift + Esc で「GPUプロセス」を強制終了する。
2. Chrome設定 で「ハードウェアアクセラレーション」をオフにする。
3. 改善しない場合は、OSを再起動してください。

症状:ブラウザ全体が重い

これはメモリ・GPU側の疑いが濃厚です。
GPUリセット → Chrome再起動 → それでもダメならMac再起動。

症状:AIタブだけ重い

これはセッション(KV cache)肥大の疑いが濃厚です。
「4.1|実践フロー」に従い、スレッドを即座に分岐(Fork)してください。

6|復旧フロー(重くなった後)

リロード連打は、状況を悪化させることがあります。
“最短で戻す手順”を決めておく。

  1. Freeze: 直近の成果物(コード/決定事項)をローカルに保存
  2. Fork: 新スレッドを起こし、現状+diffだけ渡す
  3. Reset: タブ整理、必要ならChrome再起動
  4. Verify: 受け入れ条件を1つだけ確認(コンソールも1回だけ)
  5. Resume: 小さな単位で進行し、早めに分岐する

やらないこと

  • 全文貼り直しを繰り返さない
  • 目的を増やして“混ぜない”
  • 重いまま引っ張って完走しようとしない

7|チェックリスト(コピペ用)

[AI運用チェックリスト] - 1スレッド=1目的(Plan / Build / Verify / Publish) - 現状+diffで渡す(全文貼り直しは最小化) - 一定回数でFreeze → Fork(保存して新スレッド) - 重要成果物はローカルにベースライン保存 - Chrome再起動は“予定”で行う(重くなってからでは遅い) - 重いときは Freeze → Fork → Reset → Verify → Resume