个人开发中,我曾有过“抽中上上签”的瞬间。
我制作了一个能与挑衅口吻的角色进行英语对话的 AI 英语会话,名为“小恶魔英语学习”,并写了篇文章。虽然看起来像是一次性噱头,但对我而言,这是认真的一步棋。实际上,它也成了除 Kotonia 本体之外最强的引流钩子。
但是,一段时间后,它从搜索结果中消失了。我写的原创内容不见了,只剩下本该是交叉发布的 Zenn 文章。
这篇文章记录了我为何选择这个利基市场、它如何戳中用户,以及我最终失去了什么。这不是关于实现的技术细节,而是那之前和之后的故事。
为什么是“小恶魔英语会话”
首先,前提是 AI 聊天市场已经变成了 Anthropic / OpenAI / Google 的通用模型之争。个人开发正面硬刚是赢不了的。无论是成本、模型的智能程度,都无法战胜供应商本身。
因此,我从一开始就决定瞄准“剩余领域”。“特定角色 × 语音 × 角色扮演”的沉浸式体验,在大公司的研发优先级中很低,内部审批也难以通过。在这个领域,一个人也能有所作为。这就是 Kotonia 的整体战略。
其中,选择“小恶魔英语会话”的理由,看似异想天开,实则相当有算计。
- 搜索竞争几乎为零。不存在用“小恶魔 英语会话”来竞争的 SaaS。另一方面,利基需求是明确存在的(在同人音声、VTuber 文化的延长线上)。如果是大公司不会涉足的小山头,用一个页面就能独占。
- 因为令人难忘,所以易于口碑传播。比起“AI 英语会话 Kotonia”,“那个被小恶魔嘲讽着练英语会话的东西”在社交媒体上的分享量要多几十倍。这是大公司绝对无法模仿的差异化,因为他们无法通过内部审批。
- 产品本体是相同的。直接沿用 Kotonia 的语音对话引擎,只替换角色设定。代码几乎不用增加。成功了就是赚到,失败了损失也很小。
虽然看起来很激进,但从风险与回报的计算来看,我认为这反而是一场稳健的赌注。
用户不会自己走向“语言学习”
其实,还有更深一层的故事。
Kotonia 的语音引擎采用了 Qwen3-TTS 的 CustomVoice。因为在开放权重的语音合成中,它的外语表现质量明显高出一筹。所以,从一开始,语言学习就被视为一个有力的应用场景。
然而,当我统计实际用户行为时,现实并非如此。用户并不会自己走向“语言学习”。 仅仅放上一个“可以用外语和 AI 对话”的功能,人们是不会行动的。
这大概是营销教科书第一页就会写的内容。不是模糊的益处,而是深入分析用户画像,提出个别、具体、易于想象的使用场景,让用户自己产生“啊,这说的就是我”的共鸣。只有这样,人们才会开始行动。
“AI 英语会话”这个说法太弱了。那么,具体、易于想象、让人忍不住想尝试的入口是什么?
我想到的,就是小恶魔。
为什么小恶魔和语言学习本质上很合拍
这听起来可能有一半是牵强附会,但我真心这么认为。
我会说英语和中文。在那段经历中,我对语言学习有两点强烈的感受。
其一,对初学者来说,与其指出细小的错误,不如让他们尽可能多地开口说。 初学者压倒性地缺乏经验。因此,他们还不会因为类似经验的积累而导致学习率下降。在这个阶段,不要让他们在意细节,哪怕说得支离破碎也好,总之要让他们开口,积累“即使说得不好,沟通也能成立”的成功体验,这很有效。
其二,但这个策略有其局限性。 到了中级水平,反而应该在对话中逐渐加入一些细微的语法不自然之处,或是“母语者会这么说”的语感差异,这样进步更快。然而,这与面向初学者的方法大相径庭。因此,很多人会在这个阶段难以提升,失去动力。他们会把被纠正次数增多的阶段,感觉成“在被责骂”。
如何缓和这种“中级者的挫折感”?小恶魔在这里就派上了用场。
被小恶魔嘲讽语法错误,没有人会真的受伤。倒不如说,被嘲讽并享受其中,这就像是小恶魔文化圈的某种礼仪。即使被说“噗w,母语者可不会那么说哦”,也能笑着接受。
被普通家教说同样的话,会让人觉得“被挑刺了”,但通过小恶魔这个滤镜,就能作为“嘲讽艺术”来开心地接受。角色替你承担了指正带来的心理成本。 这和语言学习真的非常合拍。
看似是一发艺,实则是“用文化机制来支撑中级者最容易受挫的环节”,设计上相当认真。
一半是成功的
实际上,有一半是成功的。
在发布了着陆页(/use/mesugaki-english/)和精心制作的文章后,对于“小恶魔英语会话”及类似查询,说明页面和我自己的文章占据了搜索结果的第1和第2位。
正如我所料。在没有竞争的利基市场,放置能精准戳中用户的内容,就能获得高位。除了 Kotonia 本体的品牌名,这成了最强大的流量入口。既有爆红的手感,也有向用户传递语言学习价值的实感,两者兼得。
个人开发中,“建立假设、制作、通过搜索获取流量”这一循环能运转得如此漂亮,老实说,我很高兴。
然后,消失了
然而有一天,我无意中用同样的查询再次搜索。
我自己的文章和说明页面,都搜不到了。
取而代之的是,本该是交叉发布的 Zenn 文章,独自占据了搜索结果的第一位。
我写在自己网站上的原创内容从搜索中消失了,只剩下原本打算作为镜像的 Zenn 文章。起初我完全不明白是怎么回事。我明明用 canonical 指定了“规范 URL 是我自己的网站”。所以我曾深信,即使把全文放在 Zenn 上也没问题。
这种违和感,成了漫长调查的开端。只说结论的话,在 Zenn 上,canonical 并没有生效。 我自以为聪明的“全文交叉发布 + 用 canonical 将自家网站规范化的做法”,实际上成了将正文和搜索评价拱手让给强大外部域名的行为。
关于那次调查的全貌,以及我如何改变运营策略(不是改用摘要,而是切换为将两个不同版本用有机链接连接起来的方针),我总结在了另一篇文章里。
→ 本以为在Zenn上设置了canonical,但实际上并未生效的故事
这篇文章(小恶魔篇),正是那个“事件”的开端。最成功的引流钩子,因为我不理解 SEO 的机制,从我手中流向了外部域名。
我学到了什么
抛开懊悔不谈,我学到了两点。
其一,利基战略本身是正确的。 在零竞争的剩余领域,用令人难忘的企划,低成本复用本体。这作为个人开发的取胜之道,具有可复制性。实际上,我也确实通过搜索获得了流量。假设是正确的。
其二,我缺少了守护成果的设计。 即使通过内容获得了高位,如果放置的位置和方式出错,就会连评价一起拱手让人。创造的能力,和将其作为自己资产保留下来的能力,是不同的技能。
因此,现在我将相同题材分为“技术版(Zenn)”和“战略与思想版(这篇文章)”,针对不同的搜索意图来写,并用有机链接连接起来。不依赖 canonical 这种小技巧,而是通过区分内容让两者都被索引,让读者都能读到。这篇文章本身,也是这个实验的一部分。
横向展开仍然有效
虽然掉进了陷阱,但企划的生命力并未消亡。
看到小恶魔英语会话的反应,我正在考虑向小恶魔中文会话、韩语会话进行横向展开。Kotonia 的 TTS 支持 10 种语言,也能选择中文和韩语的女性发音人,所以只需根据语言重写角色的口吻和 system prompt 就能增加。
像“温柔的英语老师”、“TOEIC 斯巴达式训练”这类不同方向的角色,用同样的模板,一天之内也能追加。在成功的利基市场旁边,通常就存在着下一个利基市场。
给想了解实现细节的人
这篇文章聚焦于“为何制作、结果如何”的战略与始末。
关于如何设计角色(小恶魔 × 傲娇的混合体、情感层次、嘲讽频率限制)、如何避免 ASR 的语言偏见、将范围扩大到利用 Gemini 语音输入进行发音纠正的实现、以及 system prompt 的全文公开——这些技术内容,我写在了 Zenn 的另一篇文章里。
→ 边被小恶魔 AI 用英语嘲讽边学习 — 角色设计与利用 Gemini 语音输入实现“发音纠正”的故事
实际应用已在 /use/mesugaki-english/ 公开。请去体验一下被嘲讽的感觉吧。
