EN
JP

サービス・各種
お問い合わせ

技術情報技術文書

OSSについての技術解説や、技術調査・検証レポートなどを公開しています。

プラットフォーム

【衝撃】vLLMの使い方を生成AIに聞きつづけた末路

2026/03/05

技術本部 OSS技術部チーフテックリード博士(工学)　岩本俊弘

　Ryzen AI Max+ 395 (メモリ128GB) で Qwen3-Coder-Next を vLLM で動かそうと、
　Gemini と共に一晩格闘した記録です。

　AIの自信満々な誤誘導 (FP8非対応) に振り回され、パンが焼き上がるのを待ちながら
　深夜にソースコードを改変し、最終的に見えてきた「1.2トークン/秒」の現実と、
　AI共生時代の教訓を綴ります。

　「VA Linux エンジニアブログ」にて公開していますのでご覧ください。
　https://www.valinux.co.jp/blog/entry/20260305
　
　
　

関連記事

- プラットフォーム
2025/10/03
vLLMとRDMAで構築するローカルLLMクラスタ (1)：安価なGPU選定と25GbEネットワークの基礎
- プラットフォーム
2026/01/08
vLLMとRDMAで構築するローカルLLMクラスタ (5)：Open-WebUIによるRAG基盤構築とAMD GPUの活用
- プラットフォーム
2025/11/20
vLLMとRDMAで構築するローカルLLMクラスタ (4)：PCIeボトルネックの解消とNFS over RDMA
- プラットフォーム
2025/11/13
vLLMとRDMAで構築するローカルLLMクラスタ (3)：4ノード分散推論の実装とスケーラビリティ検証