RTX PRO 6000 Blackwell Max-Q を買った。96GB VRAM、Blackwell 世代、プロ向けワークステーション GPU。個人で買うには、明らかに馬鹿でかい買い物だ。
これは GPU の開封記でも、ベンチマーク記事でもない。ここに辿り着くまでの 5 年と、買ってから何が変わったかの話。
技術的に「96GB で何が設計できるようになるか」をサービススタックで実測した話は、別記事に分けて書いた。こっちは、その手前にあった長い時間の話。
3 万円の Chromebook で勉強してた
俺がプログラムを勉強してた頃に使ってたマシンは、3 万円の Chromebook だった。
そのときの俺には、それが手に入る現実的なマシンだった。でも AI をやりたい人間にとって、3 万円の Chromebook はあまりに非力だった。
ローカル LLM どころか、少し重い開発環境ですらきつい。「いつか、ちゃんとした GPU が欲しい」と思いながら、かなり長い時間が過ぎた。
Colab でお茶を濁す日々
Google Colab も使った。無料枠や安い GPU で、なんとかそれっぽいことを試した。
動く範囲のモデルを選んで、動く範囲のコードを書いて、動く範囲の実験をした。
でも、それはずっと「お茶を濁してる」感覚だった。本当に触りたいものは載らない。少し欲張ると落ちる。セッションは切れる。毎回環境構築で時間を溶かす。
借り物の GPU、借り物の時間、借り物の実験場所。自分の夢を他人の都合に預けている感じがあった。
その間に AI はどんどん進んでいった。GPT が出て、LLM が爆発的に広がり、OSS モデルもどんどん強くなった。タイムラインには、強いマシンで OSS を試して知見を貼ってる人たちがいた。
俺もそっち側に行きたかった。
AI スタートアップに入った。でも
やっとの思いで AI スタートアップに入った。でも組織の空気としてかなりしんどいものがあって、続けられる状況ではなかった。
技術が面白くても、環境が壊れてると人間は壊れる。やっと AI に近づけたと思ったのに、そこで削られていく感覚があった。
ただ、AI そのものへの興味は消えていなかった。むしろ「自分の環境でやりたい」気持ちは強くなっていた。
フリーランスになって、ようやく投資を考えられるようになった
その後フリーランスになり、半年ほどしてようやく「自分のための大きな投資」を考えられるようになった。
そのとき、真っ先に頭に浮かんだのが GPU だった。
普通に考えればもっと堅実な使い道はいくらでもある。貯金、税金、生活防衛資金、仕事用 PC の整備。でも何年も「マシンが弱いから」で諦めてきたことを、ここでまた「いつか買う」と言ってたら、その「いつか」はまた遠くなる。
ただ、このタイミングで GPU を買う決断には、もう少し込み入った背景がある。
買う前の俺は、わりとどん底だった
時間を少し巻き戻す。
このマシンを買う少し前、主力はまだ高品質なアバタートークで、使っていた GPU は RTX 4000 Blackwell、VRAM は 24GB だった。今よりサポートする TTS エンジンも多くて、載せるために必死に量子化したり、TensorRT でコンパイルを試したり。それでも足りなくて、多言語性能の高い Qwen3-TTS を泣く泣く非表示にしたこともあった。ずっと VRAM との戦いだった。
やっとの思いでリリースした。でも、PV はほぼ 0。ユーザーもゼロだった。
並行して、サブプランも試していた。小型の飲食店やクリニック向けの、音声予約自動化の営業だ。でも結果は悲惨だった。考えてみれば当たり前で、「自動化すれば電話番の仕事がなくなる人」に、そのプロダクトを売りに行く。矛盾の塊みたいな営業だった。経営者とまともに話すことすらできず、成果はまさかの 0。精神力だけが削れていった。
悔しかった。音声部分の UX には自信があった。ReAct エージェントの基盤があるから、単純な予約だけじゃなく複雑なタスクにも耐えられる。某音声 Lab が出している API の 10 分の 1 の価格で提供しても、利益率は 9 割を超える設計だった。技術的に負ける理由が、自分には見えなかった。——もはや思い込みに近い執念で没頭していたぶん、刺さらない悔しさは大きかった。
(その時期の副産物として、自動架電システムなんかが手元に残った。あの苦労は、まるごと無駄ではなかったと今は思える。)
プレゼンすら、聞いてもらえなかった
そんな中で、当時所属していたエンジニア友人たちのグループに、プレゼンをすることにした。アテンション獲得を手伝ってほしい、という提案をするつもりだった。
でも、結果は——誰も興味がないらしかった。プレゼンすら聞きたくない、みたいな態度だった。
正直、堪えた。ここまでか。ここまで人望がなかったのか。本気でどん底だった。
「レッドオーシャンで勝ち目がない」「デザインがしょぼい」。フィードバックらしきものは色々あった。
でも、と思った。プレゼンすら聞かない、にわかの声で立ち止まるほど、俺のプロダクトはもろくない。
その日、俺は所属していたグループを抜けた。半分、喧嘩別れみたいなものだった。そして、このプロダクトにもっと集中すると決めた。170 万円の GPU を買うと腹を決めたのは、その日だった。
震える指で購入した
購入ボタンを押すとき、普通に手が震えた。「本当に買うのか?」「これは正気か?」「失敗したらどうする?」
送金しようとしたら、銀行に怪しまれて送金が止まった。そりゃそうだと思う。いきなり高額な GPU を買おうとしてる。でもこっちは人生の何かを賭けてる気持ちだったので、止められた瞬間はかなり焦った。
なんやかんやあって、最終的に購入できた。届いた瞬間、これは GPU じゃなくて、俺が諦めなかった時間の塊だと思った。
嬉しい誤算
ここで終わっていたら、ただの孤独な決別の話だ。
でも、誤算があった。
グループを抜けた後、あいつらのうちの一人がコンタクトを取ってきた。俺の覚悟を聞いて、こう言った。
「野郎が人生かけて挑むんだとしたら、俺も手を貸すしかない」
そして、そのままプロジェクトにジャンプインしてきた。新しいメンバーが加わった。
ファイアーエムブレムで、それまで敵だった裏切りの剣士が、ある章でふっと自軍に加わってくるときの——あの興奮を、久しぶりに味わった。
ひとりで諦めなかった結果が、このGPUだ。そして、諦めずに進むと決めたことで戻ってきてくれたのが、この仲間だった。
それでも、ただのエモい話で終わらせたくない
買ってよかった、で終わらせたくなかった。だから、この 96GB が個人開発で何を可能にするのかを、ちゃんと数字で確かめた。
ひとつだけ、自分の中で象徴的だった瞬間を書く。
音声ロールプレイと、絵コンテから動画を自動生成するパイプラインを回している。1 つのリクエストで、ローカル LLM・画像生成・TTS・リップシンク・動画生成が、時間軸の上で次々に点火する。reviewer が「このシーンはやり直し」と言えば、また全部を呼び直す。このフィードバックループを、モデルを毎回ロードし直さずに回せるかが、24GB の頃にはどうしても越えられない壁だった。
96GB に載せ替えて、全モデルを常駐させたまま絵コンテ生成を走らせたとき、VRAM はほぼ動かなかった。+1.9 GiB。モデルはぜんぶ warm のまま、計算だけが走る。あの瞬間、「容量を買った」んじゃなくて「常駐を買った」んだと腹落ちした。
この実測(idle のベースライン、動画 1 本生成時の VRAM の山、ローカル LLM との共存、そして 96GB でも越えられない境界線まで)は、技術編にトレース画像つきで全部書いた。
→ 5年越しに、俺は96GBのVRAMを手に入れた ― エージェントループが回る GPU の話(技術編)
何ができるようになったか
買って数週間で、動いているもの。
- Kotonia(音声ロールプレイ) — VAD + STT + LLM + 多言語 TTS + Ditto リップシンクのリアルタイム会話。本業プロダクト。
- 絵コンテ → 動画自動生成パイプライン — 1 アイディアから 5 beat 構造のショート動画を数分で。
- HiDream Studio(無料公開中) — OpenWeight 最高峰の画像生成を 96GB GPU 上で常駐運用。
- Codex CLI + ローカル Gemma 4 — OpenAI 互換のローカル LLM をサブエージェント化、API 課金ゼロで CLI agent を回す。
どれも、借り物の GPU では「いつか」だったものだ。
まとめ
5 年ぐらい「マシンが弱いから無理」と言い続けてきた。その言葉を、少しずつ過去のものにしていく。
GPU は、ただの計算資源だ。でも自分にとっては、諦めなかった時間が形になったものでもある。次は、これで何を作るか。
