vLLMとRDMAで構築するローカルLLMクラスタ (8):LLM wiki を試す

執筆者:佐藤友昭

※ 「vLLMとRDMAで構築するローカルLLMクラスタ」連載記事一覧はこちら


LLM wiki (=Obsidian での参照を想定したマークダウンテキスト群)を試す

前回、共有ストレージ機に構築したパイプラインの利用その1として、ブログ記事作成について記述した。4/10から1ヶ月間、前日付のYouTubeタイトルリストをもとにしたブログ記事をnoteに掲載するという運用を続けた。率直な感想は、膨大なYouTubeコンテンツをすべて視聴することは物理的に不可能であり、テキスト要約を読むことはその代替手段に過ぎない、というものだ。妥協ではあるが、読み続けることで自分の知識は少しずつ更新されていく。しかし、講演者の講演を聞くときの好奇心がそこにあるだろうか。
対象としている情報が(日々発信されている YouTube コンテンツのような)全部を吟味する必要のないものであれば問題はないが、自分の仕事を複数のAIエージェントに割り振っているような状況ではエージェントの仕事を吟味する必要がある。エージェントの数が多くなるほど状況を把握しつづけるための仕組みが重要になりそうである。いわゆる Human-in-the-loop の仕組みである。
そんなことを考えていたところに LLM wiki (karpathy/llm-wiki.md) の登場を知り、早速試してみることにした。これは Andrej Karpathy 氏が 4 月に公開したアイディア文書である。これを Claude Code に読ませてパイプラインに LLM wiki の更新を加えた。具体的には、M4 Max MacBookPro の定時タスクで前日付の YouTube タイトルのリスト(google/gemma-4-31b による構造化テキスト)を内容とするブログ記事(Daily/YYYY/MM/YYYY.M.D 追加.md)を作成したあと、そのブログ記事を入力とする Wiki を Claude Code エージェントが構築し、更新する。Wiki の実体は Obsidian での参照を想定したマークダウンテキスト群である。 Human-in-the-loop を実践する上で人間の認知的負荷を下げるためのアプローチとして Wiki という人間が把握しやすい形式で AI エージェントと人間が日々更新される情報を共有し続けるという試みという理解である。人間は差分ページを毎日目視確認する。
Claude Code エージェントによる実装では、以下の3つのオペレーションが用意されていた:

Ingest

新しい Daily/YYYY/MM/YYYY.M.D 追加.md が追加されたとき、その内容をTopicsページへ反映するオペレーション。Wikiへの主要な「書き込み」経路。

起動フレーズ:

N/M分を処理して欲しい

Query

Wikiに蓄積された知識を使って質問に回答するオペレーション。Topicsページを起点に参照し、必要に応じてDailyファイルで詳細を補完する。回答に使った洞察がTopicsに未記載であれば書き戻す。

起動フレーズ:
〇〇の最新動向は?
〇〇について教えて
〇〇と〇〇の違いは?

Lint

Topicsページのヘルスチェックと修正を行うオペレーション。月1回程度が目安。

起動フレーズ:

Lint を実行して
Topicsページのヘルスチェックをして

全体の INDEX ページの他、分野ごとに20の Topics ページが作成された。Topics は AI が自動分類したもので個々に指定していない。今の所、1日1回の頻度でブログ記事の Ingest を実行し、1ヶ月1回の頻度で Lint を実行している。オペレーションを実行することで INDEX ページ や Topics ページが更新される。更新は git 管理している。 ブログ記事についても見直し、現在は Ingest 実行後の差分のみを内容としている(note 掲載は前日日付をタイトルとする差分ページ1個のみを 24H 掲載している。分野ごとの Topics ページは Lint を実行後の 24H に限って掲載している。24H に限定しているのは 24H 経過後は新たな差分ページのみが最新情報となるためであるが、極力余分な情報を置かないことも認知的負荷を下げることに貢献するのではないかという思いもある)。

以下はAIが生成した差分ページの例(2026年5月23日付から抜粋):


Anthropic (企業・モデル) — sources: 151 → 154 videos

  • 追加: Andrej Karpathy、AnthropicにJoin: OpenAIの共同創設者であるAndrej Karpathyが2026年5月にAnthropicへの入社を表明した。Claude次世代モデルの事前学習研究を加速させる役割を担うとされており、元OpenAI CSO・テスラAIディレクターという経歴を持つ人物の電撃移籍はAI業界全体に衝撃を与えた。GoogleのGeminiとの3極体制において、Anthropicの技術力強化を象徴する出来事として受け止められている。

  • 追加: AnthropicがビジネスAI支出でOpenAIを逆転: RAMのクレジットカード利用データによると、AIサービス支出においてAnthropic(34.4%)がOpenAI(32.3%)を初めて上回った。AnthropicはAPIビジネスやClaude Codeなどのコーディング支援に集中するB2B戦略が功を奏している一方、OpenAIは消費者向けアプリ・ブラウザ・広告まで展開し焦点が分散しているとジャーナリストEric Newcomerが分析した。両社とも2030年までの黒字化を目標とするが、そこまでに数百億ドル規模の追加投資が必要とされる。


差分ページの文字数は数千文字程度で、従来の記事(Daily/YYYY/MM/YYYY.M.D 追加.md)と比べて約1/10になった。1日1個の差分ページを読んで頭の中のTopicsを更新していく、というのが日々の運用イメージである。 AIエージェントを管理する上で人間に求められるのは、各エージェントの状況を継続的に把握し続けることだ。エージェントの活動報告をLLM wikiと同様の形式で整理できれば、その監視負荷を「差分ページを1日1枚読む」程度まで下げられる可能性がある。何枚のTopicsページを無理なく維持できるかは、一人が実用的に管理できるエージェント数を測る指標の一つになるかもしれない。