Linux PC と RDMA ネットワークで vLLM スケールアウト構成を構築し、コストパフォーマンス重視のローカルLLM実行環境を提案・検証します。 前回の「AI特需に対応: 安価なGPUの可能性 (3)」の内容を踏まえた続編です。
Linux PC と RDMA ネットワークで vLLM スケールアウト構成を構築し、コストパフォーマンス重視のローカルLLM実行環境を提案・検証します。 前回の『AI特需に対応: 安価なGPUの可能性 (2)』の内容を踏まえた続編です。
遅延処理の仕組みである Workqueue (WQ) を、現在のWQの特徴であるConcurrency Management導入前後の実装を比較しながら紐解きます。
Linux PC と RDMA ネットワークで vLLM スケールアウト構成を構築し、コストパフォーマンス重視のローカルLLM実行環境を提案・検証します。 本記事は「AI特需に対応: 安価なGPUの可能性 (1)」の続編です。
Linux PC と RDMA ネットワークで vLLM スケールアウト構成を構築し、コストパフォーマンス重視のローカルLLM実行環境を提案・検証します。
カーネルv6.8のタスクスケジューラ解説シリーズの第3弾です。前回で解説したFAIRスケジューリングクラスとEEVDFアルゴリズムに続き、残るスケジューリングクラスであるRTおよびDEADLINEの仕組みと実装を深掘りします。
Linuxのコードを読むと、つい細部に気を取られて本質から外れてしまうことがあります。本ブログでは「これは何だろう?」と思う部分について、深追いせず理解できる情報を提供し、コード読解の負担を軽減することを目指します。
最終回となる本記事では、過去の記事では触れられなかったエグゼキューターのより高度な概念と詳細について解説します。特に、本記事のEventsExecutorに関する内容はActionの章と関連が深いため、順番に読むことを推奨します。
Linuxコード解析の初心者向けシリーズがスタート! 本シリーズでは、Linuxにテーマを絞り、これからコード解析に挑戦したい方に向けて"入口"となる情報をお届けします。 筆者の視点から、「ちょっと気になるポイント」や「今さら聞けない基礎知識」をやさし…
3回目となる本記事では、前回までの記事で触れられなかったエグゼキューターに関する少し高度な概念や細かい内容について紹介していきます。