Kotonia Articles

AI 让我「别再写技术文章了」，于是我把这件事写成了一篇技术文章

我让 Claude Fable 5 对我的产品和战略做了一次对抗性 review。它没指出技术漏洞，反而戳穿了四个经营层面的窟窿。一个独立开发者把 AI 当作董事会对手的可复现流程，以及为什么 Opus 系列从没做到这一点。

作者清水真二2026-06-174分钟阅读

#AI#Claude#独立开发#创业#LLM

其他语言日语英语

编辑注 (2026-06-18)：本文提到的 Claude Fable 5 模型，目前已经无法通过 Anthropic 访问。它存在的窗口很短，但当时给我的几条点评至今仍然有效，所以把这篇当作那个窗口内发生过的事的存档保留下来。

「AI 让我『别再写技术文章了』，于是我把这件事写成了一篇技术文章」——这一句就是整篇文章的全部。

先说清楚：下面引用的对话，是从日志里整理重组的，不是逐字原文。但内容没有夸张。其实根本没必要夸张——对方戳下去的那几下，已经够疼了。

发生了什么

Claude 出了一个新模型叫 Fable 5，我抱着随便玩玩的心态，让它评一下我自己的产品（Kotonia——一个专注语音的 AI 角色扮演平台）。问的是「我的战略到底有没有胜算？我的做法是不是站得住？想听点真话」。

我以为会回来一份代码 review。回来的是一场董事会。

技术是真的。工程纪律可以排进前 1%。但按现在这个战略走下去，胜算很薄。原因不在技术，也不在执行力，而是你「在为谁做」和「正在送到谁手上」错位了。

它把仓库里的战略文档、流量调研、最近的 commit log 都读了一遍之后，接着说：

会去读你那篇「LTX-2 cold-start VRAM 优化」的人，不会为 AI 角色付费。

我无话可说。

前提：我现在的状况

数字藏起来没意义，直接写：

注册用户大约 40 人。每天有几个新用户，但流失率很高。
角色对话相关的 SEO 大约排在第 3 页前后。部分文章拿到了 SEO 第 1。
自然搜索点击每天不到 10。每天 ~50 PV 里，大部分来自 X 或者外部技术文章。
技术栈是本地两张 GPU 跑 voice + 对口型虚拟形象，端到端 ~1 秒，边际成本接近零。我认为目前世界范围内还没有人提供同等的体验。

换成一句话：「技术有了，商业信号几乎为零」。这是个人开发者最经典的悬崖边。

AI 戳穿的四个窟窿

1. ICP 和渠道错位

产品的客户是「愿意为角色对话付钱的非技术用户」。但 distribution 的主炮口是 Zenn 上的技术文章。文章会被读、SEO 会被拿，但门口出现的都是来观光的工程师，不是买家。我自己也隐约知道——进站流量里真正的目标客户大概只占两成。AI 直接指着我自己的 analytics 文档说「数字摆在你这里」。

角色类产品只有当角色本身成了内容才会卖。虚拟形象开口讲话的一段 30 秒视频，比 10 篇 VRAM 优化文章离客户都更近。

2. 没有价签的验证不叫验证

我之前给自己的说法是：「打散弹枪，撞上哪个就深做哪个」。AI 的回复是：

在这个市场，免费用户的高流失基本是噪音。能用来判断的唯一信号是「付不付」。你最缺的实验不是下一个原型，是收费本身。

每个原型上线时，必须配齐 kill 标准 + 价签 + 分发帖 这三件套。三件齐了，散弹枪打法才能从「乱跑」变成「测试」。我当天就把这条立成了内部规则。

3. 在零需求上投入供给

就在这场对话之前，我还在认真考虑为了支持并发会话买一台大约 140 万日元的 GPU 集群扩容。AI 的话很直白：「你当前的并发会话数实际上是零，现有配置能撑 4–5 个。队伍排起来了再买，到时也买得起。」我把购买的触发条件改成「同时 3 路会话变成常态」，扩容计划先搁置。

工程师就是会比需求先一步把供给做出来。因为做得出来。

4. 「我没品位」是回去写代码最舒服的借口

最疼的是这一条。我承认自己想用视频做 distribution，但自己的品位是绝望的瓶颈。回复是：

在这个市场用不到「品位」。渠道的约束已经把答案锁掉一半，胜出格式都是公开可观测的。把头部账号的模板收集起来照搬就行。 你的强项是量产 pipeline 和度量循环，那本身就是品位的完美替代品。把假设（也就是「格式」）做出 10 个变体，让数字来挑，写进 playbook——这是和 VRAM 优化一模一样的循环。而且「我没品位所以做不了视频」，会是你能找到的回去写代码最舒服的那个借口。

它要我把已经在技术侧验证过的学习循环，原封不动地对准需求侧。我没东西反驳。

为什么以前的模型做不到这一点

Opus 系我也壁打过不止一次。回来的总是「问得好，有三个选项可以考虑」那种结构：整理是有用，决策推不动。这次不一样，差三点：

先读一手资料再下结论。 它会把仓库里的战略文档、我自己的 analytics 调研、commit log 都读一遍，然后说「你 5/26 那份调研里这个数字就说明了这一点」。打你的不是通论，是你自己的数据。
它对结论 commit。 「胜算很薄。但修好就有。要修的是这四条，顺序如下。」不打太极。
先把不好听的话说出来的 EQ。 奉承和直率的比例像一位称职的人类顾问。话很重，但奇怪的是不会让人来气。

我以前是按基准测试感受模型代差的。这一代我是用「能不能坐在董事会对面那张椅子上」感受出来的。

复现：把 AI 当董事会对手用

方法很简单，估计任何人都能复现。

把真实数字交出去。 用户、流量、流失、营收。让你脸红的数字最值钱。藏起来，回来就是通论。
让文档可读。 战略备忘、调研日志、git log 放进仓库里（我都在 CLAUDE.md 和 docs/ 下）。然后对 AI 说：先读完再评估。
以对抗的姿态问。 不要说「帮我 review」，要说「请坦率地告诉我我的战略有没有胜算」。用希望被夸的问法，回来的就是夸奖。
让它把结论写进 git。 留在对话里就会蒸发。我让它把结论作为战略文档 commit 进去，变成跨终端的 SoT。
回嘴。 你补上背景之后，评估会被刷新。第三轮的判断比第一轮锐利得多。

结果，到底有什么变了

优先级反过来了：「下一步要做什么」→「先用最快的方式确认谁会付钱」。
立了个运行规则：本周的 distribution 配额没消化掉之前，不允许开新子系统。
当天就动手：当晚把其中一位角色的 X 账号建好，第一条贴文也排上了。
技术文章被降级成「每月一篇随手写的开发日记」。它的职责是维护 SEO 和信用感，不是获客主炮。

战略的具体内容——在哪个市场、用什么收费设计验证——是内部文档话题，这里就不写了。我写出来的只是方法。方法谁用都管用。

收尾

你大概已经看出来了。这篇文章本身，就是在 AI 把它降级成「每月随手写一篇」之后写下来的。而且因为它特意叮嘱「先把本周分发配额消化掉再写」，所以我是先排好了 X 的贴文，才坐下来写这篇的。

个人开发是孤独的。没有一个可以把你的决策掰过来的对手，这件事是比技术本身深得多的瓶颈。这一轮的发现是：终于出现了一个能坐在那张椅子上的存在。

下一次汇报，多半就是关于数字的了。