今天,从我自己写过却已经遗忘的 memory 文件里,复活了 4 篇文章的「雏形」。
「个人开发者的累积资产会复利」这句一直停留在抽象层面的话,第一次被我自己亲手实现了出来。
1. 个人开发者本该独有的优势
在组织里工作时,知识会通过人持续流失:员工离职、关注点转移、共享成本太高。一年前有人解决过的问题,半年后另一个人会从同一个地方掉进去——这种事我见过太多次。
而个人开发者,理论上在这里很强。所有的知见都在同一个脑袋里,共享成本是零,累积应该能不断累积。
但实际上我并不是这样。
我已经写了将近 70 个 memory 文件,每个 1–3KB 的浓缩知见,用 MEMORY.md 的 hook 做了便于检索的索引。即便如此,我还是会突然想到「这个我好像在哪写过?」——半遗忘地重新发现自己过去的发现。Git log 里有解决过同样问题的 commit,但我想不起来。
要填上这个差距的,归根到底是「想起来并把它说出来的劳动」。这个劳动被我自己的认知容量限速。只要它还在被限速,个人开发者理论上的优势就永远不会真正实现。
2. 把 Claude Code 能运转的原因,移植到自己的文章 pipeline 上
Claude Code 的 memory 机制,提供了一个相似形态的提示。
每次 session 开始时,MEMORY.md 的所有 hook 都会被自动压进 context。每个 hook 是站在「下一次 session 的我被问到什么的时候应该想起什么」这个视角写的。聪明的模型持有 index,在需要时去取 full body。它能运转的结构性原因可以拆成三件事:
- 每个 entry 很小 —— 1–3KB、一个主题。子主题不会埋在正文里
- hook 是 retrieval-tuned 的 —— 检索词会在 hook 里反复出现
- 聪明的模型半自动地写 hook —— 过去的我,在为未来的我做浓缩
这三个结构都齐了,累积资产就开始复利。
我自己的服务 Kotonia 的技术博客已经积累了 58 篇文章。把同样的 index 机制带过来,理论上就能从过去的语料中机械地发现未踏的概念。
问题是,文章这一侧的结构正好相反。每篇 5–15KB,重要的子主题埋在 section 正文里,description 是 SEO 摘要而不是 retrieval-tuned 的,对 agent 来说太重读不进去。
我用一个被命名为 「Dreaming layer」 的中间层把它们连起来。原始文章 (episodic) → semantic index (consolidated) → agent 反向查找,这正好是生物学上「睡眠中记忆 consolidation」的比喻原型。
技术细节写在另一篇里:Zenn: 把 Claude Code 的记忆模型作为 Dreaming Layer 移植到 58 篇文章的实现笔记
3. 今天,4 篇 draft 复活了
跑完 pipeline 之后:
- 58 篇文章被压缩进 semantic index(importance score 1–9,分布大致呈钟形)
- 70 个 memory 文件被挖掘出未踏的概念,投入 ideas pool
- 4 个 idea 经过 Codex + 本地 26B uncensored 生成 draft,落到
articles/_drafts/
让我意外的是,虽然素材全部是我自己写的 memory,但我对每一个都浮现出「啊,这就是我一直想写的那篇」的感觉。
具体一点:
- ASR/TTS 短样本 A/B 测试的陷阱 —— Qwen3-ASR 1.7B → 0.6B 替换、生产环境劣化、revert 的故事
- 用 CodeFormer 做面部清理 —— 0.54GiB/1.2s 的颗粒去除、Rust 端的接线
- voice chat 的拟声词暴走 —— 用 frequency_penalty 控制感情峰值
- Stripe Product ID vs Price ID —— 「无法结算」的陷阱与防御策略
每一篇在我的 memory 里都有对应的条目,过去的我也确实写下了「这是个重要发现」。但这份记忆已经不再自然地从现在的脑子里浮上来了。pipeline 替我承担了「想起来并把它说出来」这部分劳动的那一瞬间,累积资产第一次开始作为复利立起来了。
4. 结构性的失败,结构性地修
中途,我自己也漏掉的 3 件重复溜过去了。「等等,这跟既存文章的 §3.3 重复了吧?」是某个瞬间突然意识到的,逼我把整条 pipeline 重新审视一遍。
原因是我把 agent 的自我规律(在 prompt 里写「与 flagship 文章重叠就 REJECT」)当成可信的,没有放 enforcement 层。我把 TF-IDF 检查焊进 tool 层,agent 在结构上不可能再违反规则。
这部分单独成文:别相信 agent 的自我规律 —— 用 tool 层 blocking 做结构性修复
5. 真正成立的复利条件
loop 实际转起来之后,个人开发者的累积资产开始复利的条件,我整理成 3 条:
- 原始资产首先要积累得够多(memory 文件、commit message 里的「为什么」、开发日志、决策依据)
- 存在一个把原始资产做 semantic 压缩的 consolidation 层(不需要人写,可以交给 agent)
- mining / drafting / dedup 都通过 semantic index 走(直接舔原始资产会让 context 崩溃)
反过来说,没有这 3 件事到位的开发者,再做多少年也只是「永远只盯着眼前的问题」,累积就不会作为累积起作用。整理 memory + git 不是「回顾」的仪式,而是对未来自我自走能力的复利投资。
组织在 #1 这一步会卡住(只活在某个人脑子里的记忆会消失)。个人开发者容易卡在 #2/#3(你写了,但你拿不出来)。前者结构上没法解,后者可以靠 agent loop 解决。
我想,这才是「只有个人开发者才能做到的知识复利」真正立起来的条件。
余谈:这篇文章是怎么写的
这篇文章本身并不是从我刚才描述的 pipeline 里出来的,而是另一条路径——直接写。原因是:「新鲜的体感直接写更快、更准、更有作者的声音」。
pipeline 能发光的地方是「过去的我已经遗忘的知见」的发掘,正在进行中的事情还是人来写更快、更准。两条路径有意识地分工,是今天这个 loop 的用法原则。
Kotonia 上的其他技术文章也欢迎阅读。
