Ryzen AI Max+ 395 (メモリ128GB) で Qwen3-Coder-Next を vLLM で動かそうと、
 Gemini と共に一晩格闘した記録です。

 AIの自信満々な誤誘導 (FP8非対応) に振り回され、パンが焼き上がるのを待ちながら
 深夜にソースコードを改変し、最終的に見えてきた「1.2トークン/秒」の現実と、
 AI共生時代の教訓を綴ります。

 「VA Linux エンジニアブログ」にて公開していますのでご覧ください。
 https://www.valinux.co.jp/blog/entry/20260305