Kotonia
ログイン今すぐ始める

Kotonia Articles

3万円のChromebookから、96GBのGPUへ ― 5年越しに諦めなかった話

AIをやりたくても非力なマシンしかなかった5年。Colabでお茶を濁し、震える指でRTX PRO 6000 Blackwell(96GB)を買うまでの、個人開発者の記録。

著者 5分で読める
#個人開発#GPU#AI#ポエム#キャリア
他の言語中国語

RTX PRO 6000 Blackwell Max-Q を買った。96GB VRAM、Blackwell 世代、プロ向けワークステーション GPU。個人で買うには、明らかに馬鹿でかい買い物だ。

これは GPU の開封記でも、ベンチマーク記事でもない。ここに辿り着くまでの 5 年と、買ってから何が変わったかの話。

技術的に「96GB で何が設計できるようになるか」をサービススタックで実測した話は、別記事に分けて書いた。こっちは、その手前にあった長い時間の話。

3 万円の Chromebook で勉強してた

俺がプログラムを勉強してた頃に使ってたマシンは、3 万円の Chromebook だった。

そのときの俺には、それが手に入る現実的なマシンだった。でも AI をやりたい人間にとって、3 万円の Chromebook はあまりに非力だった。

ローカル LLM どころか、少し重い開発環境ですらきつい。「いつか、ちゃんとした GPU が欲しい」と思いながら、かなり長い時間が過ぎた。

Colab でお茶を濁す日々

Google Colab も使った。無料枠や安い GPU で、なんとかそれっぽいことを試した。

動く範囲のモデルを選んで、動く範囲のコードを書いて、動く範囲の実験をした。

でも、それはずっと「お茶を濁してる」感覚だった。本当に触りたいものは載らない。少し欲張ると落ちる。セッションは切れる。毎回環境構築で時間を溶かす。

借り物の GPU、借り物の時間、借り物の実験場所。自分の夢を他人の都合に預けている感じがあった。

その間に AI はどんどん進んでいった。GPT が出て、LLM が爆発的に広がり、OSS モデルもどんどん強くなった。タイムラインには、強いマシンで OSS を試して知見を貼ってる人たちがいた。

俺もそっち側に行きたかった。

AI スタートアップに入った。でも

やっとの思いで AI スタートアップに入った。でも組織の空気としてかなりしんどいものがあって、続けられる状況ではなかった。

技術が面白くても、環境が壊れてると人間は壊れる。やっと AI に近づけたと思ったのに、そこで削られていく感覚があった。

ただ、AI そのものへの興味は消えていなかった。むしろ「自分の環境でやりたい」気持ちは強くなっていた。

フリーランスになって、ようやく投資を考えられるようになった

その後フリーランスになり、半年ほどしてようやく「自分のための大きな投資」を考えられるようになった。

そのとき、真っ先に頭に浮かんだのが GPU だった。

普通に考えればもっと堅実な使い道はいくらでもある。貯金、税金、生活防衛資金、仕事用 PC の整備。でも何年も「マシンが弱いから」で諦めてきたことを、ここでまた「いつか買う」と言ってたら、その「いつか」はまた遠くなる。

ただ、このタイミングで GPU を買う決断には、もう少し込み入った背景がある。

買う前の俺は、わりとどん底だった

時間を少し巻き戻す。

このマシンを買う少し前、主力はまだ高品質なアバタートークで、使っていた GPU は RTX 4000 Blackwell、VRAM は 24GB だった。今よりサポートする TTS エンジンも多くて、載せるために必死に量子化したり、TensorRT でコンパイルを試したり。それでも足りなくて、多言語性能の高い Qwen3-TTS を泣く泣く非表示にしたこともあった。ずっと VRAM との戦いだった。

やっとの思いでリリースした。でも、PV はほぼ 0。ユーザーもゼロだった。

並行して、サブプランも試していた。小型の飲食店やクリニック向けの、音声予約自動化の営業だ。でも結果は悲惨だった。考えてみれば当たり前で、「自動化すれば電話番の仕事がなくなる人」に、そのプロダクトを売りに行く。矛盾の塊みたいな営業だった。経営者とまともに話すことすらできず、成果はまさかの 0。精神力だけが削れていった。

悔しかった。音声部分の UX には自信があった。ReAct エージェントの基盤があるから、単純な予約だけじゃなく複雑なタスクにも耐えられる。某音声 Lab が出している API の 10 分の 1 の価格で提供しても、利益率は 9 割を超える設計だった。技術的に負ける理由が、自分には見えなかった。——もはや思い込みに近い執念で没頭していたぶん、刺さらない悔しさは大きかった。

(その時期の副産物として、自動架電システムなんかが手元に残った。あの苦労は、まるごと無駄ではなかったと今は思える。)

プレゼンすら、聞いてもらえなかった

そんな中で、当時所属していたエンジニア友人たちのグループに、プレゼンをすることにした。アテンション獲得を手伝ってほしい、という提案をするつもりだった。

でも、結果は——誰も興味がないらしかった。プレゼンすら聞きたくない、みたいな態度だった。

正直、堪えた。ここまでか。ここまで人望がなかったのか。本気でどん底だった。

「レッドオーシャンで勝ち目がない」「デザインがしょぼい」。フィードバックらしきものは色々あった。

でも、と思った。プレゼンすら聞かない、にわかの声で立ち止まるほど、俺のプロダクトはもろくない。

その日、俺は所属していたグループを抜けた。半分、喧嘩別れみたいなものだった。そして、このプロダクトにもっと集中すると決めた。170 万円の GPU を買うと腹を決めたのは、その日だった。

震える指で購入した

購入ボタンを押すとき、普通に手が震えた。「本当に買うのか?」「これは正気か?」「失敗したらどうする?」

送金しようとしたら、銀行に怪しまれて送金が止まった。そりゃそうだと思う。いきなり高額な GPU を買おうとしてる。でもこっちは人生の何かを賭けてる気持ちだったので、止められた瞬間はかなり焦った。

なんやかんやあって、最終的に購入できた。届いた瞬間、これは GPU じゃなくて、俺が諦めなかった時間の塊だと思った。

嬉しい誤算

ここで終わっていたら、ただの孤独な決別の話だ。

でも、誤算があった。

グループを抜けた後、あいつらのうちの一人がコンタクトを取ってきた。俺の覚悟を聞いて、こう言った。

「野郎が人生かけて挑むんだとしたら、俺も手を貸すしかない」

そして、そのままプロジェクトにジャンプインしてきた。新しいメンバーが加わった。

ファイアーエムブレムで、それまで敵だった裏切りの剣士が、ある章でふっと自軍に加わってくるときの——あの興奮を、久しぶりに味わった。

ひとりで諦めなかった結果が、このGPUだ。そして、諦めずに進むと決めたことで戻ってきてくれたのが、この仲間だった。

それでも、ただのエモい話で終わらせたくない

買ってよかった、で終わらせたくなかった。だから、この 96GB が個人開発で何を可能にするのかを、ちゃんと数字で確かめた。

ひとつだけ、自分の中で象徴的だった瞬間を書く。

音声ロールプレイと、絵コンテから動画を自動生成するパイプラインを回している。1 つのリクエストで、ローカル LLM・画像生成・TTS・リップシンク・動画生成が、時間軸の上で次々に点火する。reviewer が「このシーンはやり直し」と言えば、また全部を呼び直す。このフィードバックループを、モデルを毎回ロードし直さずに回せるかが、24GB の頃にはどうしても越えられない壁だった。

96GB に載せ替えて、全モデルを常駐させたまま絵コンテ生成を走らせたとき、VRAM はほぼ動かなかった。+1.9 GiB。モデルはぜんぶ warm のまま、計算だけが走る。あの瞬間、「容量を買った」んじゃなくて「常駐を買った」んだと腹落ちした。

この実測(idle のベースライン、動画 1 本生成時の VRAM の山、ローカル LLM との共存、そして 96GB でも越えられない境界線まで)は、技術編にトレース画像つきで全部書いた。

5年越しに、俺は96GBのVRAMを手に入れた ― エージェントループが回る GPU の話(技術編)

何ができるようになったか

買って数週間で、動いているもの。

  • Kotonia(音声ロールプレイ) — VAD + STT + LLM + 多言語 TTS + Ditto リップシンクのリアルタイム会話。本業プロダクト。
  • 絵コンテ → 動画自動生成パイプライン — 1 アイディアから 5 beat 構造のショート動画を数分で。
  • HiDream Studio(無料公開中) — OpenWeight 最高峰の画像生成を 96GB GPU 上で常駐運用。
  • Codex CLI + ローカル Gemma 4 — OpenAI 互換のローカル LLM をサブエージェント化、API 課金ゼロで CLI agent を回す。

どれも、借り物の GPU では「いつか」だったものだ。

まとめ

5 年ぐらい「マシンが弱いから無理」と言い続けてきた。その言葉を、少しずつ過去のものにしていく。

GPU は、ただの計算資源だ。でも自分にとっては、諦めなかった時間が形になったものでもある。次は、これで何を作るか。

Kotonia を試してみる →

Kotonia は音声AI、AIチャット、画像生成、チーム共有をひとつにまとめたAIワークスペースです。

試してみる