Ryzen AI Max+ 395 (メモリ128GB) で Qwen3-Coder-Next を vLLM で動かそうと、Gemini と共に一晩格闘した記録です。AIの自信満々な誤誘導 (FP8非対応) に振り回され、パンが焼き上がるのを待ちながら深夜にソースコードを改変し、最終的に見えてきた「1.2ト…
マルチコアCPU環境でパケット処理負荷を複数のCPUコアに分散し、受信性能を高速化する技術(RSS/RPS/RFS/aRFS)について解説します。本稿では特に、ソフトウェア実装であるRPS/RFSの具体的な動作に焦点を当てます。
Linuxが提供するIPCメカニズムであるNetlinkの基本仕様や通信モデルを解説し、rtnetlinkを例にカーネル内部でどのように実装・処理されているかを具体的に紹介します。
本連載は「RISC-V OSを作ろう」シリーズの流れを踏まえ、ARM64アーキテクチャを対象に自作OS開発を行います。ターゲットマシンとしてRaspberry Pi 4 を利用します。
Linux PC と RDMA ネットワークで vLLM スケールアウト構成を構築し、コストパフォーマンス重視のローカルLLM実行環境を提案・検証します。 前回の「vLLMとRDMAで構築するローカルLLMクラスタ (4)」の内容を踏まえた続編です。
red-black tree についての解説後編です。今回は、削除のアルゴリズムを図解+コードで解説します。
リンクリストより複雑で、Linuxでよく使われている red-black tree を紹介します。 今回は、その前編ということで、red-black tree の概要と挿入操作について、カーネル実装と併せて解説します。
KVM がどのように仮想マシンを実現しているかを、Qemu との連携を含めて解説します。 CPUの仮想化、メモリの仮想化、割り込みの仮想化、デバイスの仮想化について見ていきましょう。
前回は、受信パケットがIP層に到達した後の処理について解説しました。 今回は、その続きとなるUDPレイヤーの処理について解説していきます。
Linux PC と RDMA ネットワークで vLLM スケールアウト構成を構築し、コストパフォーマンス重視のローカルLLM実行環境を提案・検証します。 前回の「vLLMとRDMAで構築するローカルLLMクラスタ (3)」の内容を踏まえた続編です。