Kotonia
ログイン今すぐ始める

Kotonia Articles

AI 让我「别再写技术文章了」,于是我把这件事写成了一篇技术文章

我让 Claude Fable 5 对我的产品和战略做了一次对抗性 review。它没指出技术漏洞,反而戳穿了四个经营层面的窟窿。一个独立开发者把 AI 当作董事会对手的可复现流程,以及为什么 Opus 系列从没做到这一点。

作者 4分钟阅读
#AI#Claude#独立开发#创业#LLM
其他语言日语英语

编辑注 (2026-06-18):本文提到的 Claude Fable 5 模型,目前已经无法通过 Anthropic 访问。它存在的窗口很短,但当时给我的几条点评至今仍然有效,所以把这篇当作那个窗口内发生过的事的存档保留下来。

「AI 让我『别再写技术文章了』,于是我把这件事写成了一篇技术文章」——这一句就是整篇文章的全部。

先说清楚:下面引用的对话,是从日志里整理重组的,不是逐字原文。但内容没有夸张。其实根本没必要夸张——对方戳下去的那几下,已经够疼了。

发生了什么

Claude 出了一个新模型叫 Fable 5,我抱着随便玩玩的心态,让它评一下我自己的产品(Kotonia——一个专注语音的 AI 角色扮演平台)。问的是「我的战略到底有没有胜算?我的做法是不是站得住?想听点真话」。

我以为会回来一份代码 review。回来的是一场董事会。

技术是真的。工程纪律可以排进前 1%。但按现在这个战略走下去,胜算很薄。原因不在技术,也不在执行力,而是你「在为谁做」和「正在送到谁手上」错位了。

它把仓库里的战略文档、流量调研、最近的 commit log 都读了一遍之后,接着说:

会去读你那篇「LTX-2 cold-start VRAM 优化」的人,不会为 AI 角色付费。

我无话可说。

前提:我现在的状况

数字藏起来没意义,直接写:

  • 注册用户大约 40 人。每天有几个新用户,但流失率很高。
  • 角色对话相关的 SEO 大约排在第 3 页前后。部分文章拿到了 SEO 第 1。
  • 自然搜索点击每天不到 10。每天 ~50 PV 里,大部分来自 X 或者外部技术文章。
  • 技术栈是本地两张 GPU 跑 voice + 对口型虚拟形象,端到端 ~1 秒,边际成本接近零。我认为目前世界范围内还没有人提供同等的体验。

换成一句话:「技术有了,商业信号几乎为零」。这是个人开发者最经典的悬崖边。

AI 戳穿的四个窟窿

1. ICP 和渠道错位

产品的客户是「愿意为角色对话付钱的非技术用户」。但 distribution 的主炮口是 Zenn 上的技术文章。文章会被读、SEO 会被拿,但门口出现的都是来观光的工程师,不是买家。我自己也隐约知道——进站流量里真正的目标客户大概只占两成。AI 直接指着我自己的 analytics 文档说「数字摆在你这里」。

角色类产品只有当角色本身成了内容才会卖。虚拟形象开口讲话的一段 30 秒视频,比 10 篇 VRAM 优化文章离客户都更近。

2. 没有价签的验证不叫验证

我之前给自己的说法是:「打散弹枪,撞上哪个就深做哪个」。AI 的回复是:

在这个市场,免费用户的高流失基本是噪音。能用来判断的唯一信号是「付不付」。你最缺的实验不是下一个原型,是收费本身。

每个原型上线时,必须配齐 kill 标准 + 价签 + 分发帖 这三件套。三件齐了,散弹枪打法才能从「乱跑」变成「测试」。我当天就把这条立成了内部规则。

3. 在零需求上投入供给

就在这场对话之前,我还在认真考虑为了支持并发会话买一台大约 140 万日元的 GPU 集群扩容。AI 的话很直白:「你当前的并发会话数实际上是零,现有配置能撑 4–5 个。队伍排起来了再买,到时也买得起。」我把购买的触发条件改成「同时 3 路会话变成常态」,扩容计划先搁置。

工程师就是会比需求先一步把供给做出来。因为做得出来。

4. 「我没品位」是回去写代码最舒服的借口

最疼的是这一条。我承认自己想用视频做 distribution,但自己的品位是绝望的瓶颈。回复是:

在这个市场用不到「品位」。渠道的约束已经把答案锁掉一半,胜出格式都是公开可观测的。把头部账号的模板收集起来照搬就行。 你的强项是量产 pipeline 和度量循环,那本身就是品位的完美替代品。把假设(也就是「格式」)做出 10 个变体,让数字来挑,写进 playbook——这是和 VRAM 优化一模一样的循环。而且「我没品位所以做不了视频」,会是你能找到的回去写代码最舒服的那个借口。

它要我把已经在技术侧验证过的学习循环,原封不动地对准需求侧。我没东西反驳。

为什么以前的模型做不到这一点

Opus 系我也壁打过不止一次。回来的总是「问得好,有三个选项可以考虑」那种结构:整理是有用,决策推不动。这次不一样,差三点:

  1. 先读一手资料再下结论。 它会把仓库里的战略文档、我自己的 analytics 调研、commit log 都读一遍,然后说「你 5/26 那份调研里这个数字就说明了这一点」。打你的不是通论,是你自己的数据。
  2. 它对结论 commit。 「胜算很薄。但修好就有。要修的是这四条,顺序如下。」不打太极。
  3. 先把不好听的话说出来的 EQ。 奉承和直率的比例像一位称职的人类顾问。话很重,但奇怪的是不会让人来气。

我以前是按基准测试感受模型代差的。这一代我是用「能不能坐在董事会对面那张椅子上」感受出来的。

复现:把 AI 当董事会对手用

方法很简单,估计任何人都能复现。

  1. 把真实数字交出去。 用户、流量、流失、营收。让你脸红的数字最值钱。藏起来,回来就是通论。
  2. 让文档可读。 战略备忘、调研日志、git log 放进仓库里(我都在 CLAUDE.md 和 docs/ 下)。然后对 AI 说:先读完再评估。
  3. 以对抗的姿态问。 不要说「帮我 review」,要说「请坦率地告诉我我的战略有没有胜算」。用希望被夸的问法,回来的就是夸奖。
  4. 让它把结论写进 git。 留在对话里就会蒸发。我让它把结论作为战略文档 commit 进去,变成跨终端的 SoT。
  5. 回嘴。 你补上背景之后,评估会被刷新。第三轮的判断比第一轮锐利得多。

结果,到底有什么变了

  • 优先级反过来了:「下一步要做什么」→「先用最快的方式确认谁会付钱」。
  • 立了个运行规则:本周的 distribution 配额没消化掉之前,不允许开新子系统。
  • 当天就动手:当晚把其中一位角色的 X 账号建好,第一条贴文也排上了。
  • 技术文章被降级成「每月一篇随手写的开发日记」。它的职责是维护 SEO 和信用感,不是获客主炮。

战略的具体内容——在哪个市场、用什么收费设计验证——是内部文档话题,这里就不写了。我写出来的只是方法。方法谁用都管用。

收尾

你大概已经看出来了。这篇文章本身,就是在 AI 把它降级成「每月随手写一篇」之后写下来的。而且因为它特意叮嘱「先把本周分发配额消化掉再写」,所以我是先排好了 X 的贴文,才坐下来写这篇的。

个人开发是孤独的。没有一个可以把你的决策掰过来的对手,这件事是比技术本身深得多的瓶颈。这一轮的发现是:终于出现了一个能坐在那张椅子上的存在。

下一次汇报,多半就是关于数字的了。

Kotonia 将语音 AI、AI 聊天、图像生成和团队协作整合到一个 AI 工作区中。

试用 Kotonia