每周见闻(63):省 Token 的方法不学一下么?
约 3166 字大约 11 分钟
2026-04-18
每周见闻:2026-04-13 - 2026-04-19
省 Token 的方法不学一下么?
因为最近在看 AI 相关的内容,这周有许多宝玉老师的文章。AI 时代下 Token 即成本,成本控制是无论什么时候都需要关注的事情。尤其是当你订阅了许多 AI 工具后在看账单,很可能会吓你一跳。
其中宝玉老师和 Tw93 大佬关于 Claude Code 的 Token 管理方法,都值得学习。
技术
1、Claude Code 省 Token 指南:慎用 1M 上下文,不开新会话或者总是开新会话都不对[^1]
标签:Claude,AI
宝玉老师的文章,非常清晰地分析了 Claude Code 中配额消耗过快的原因,并提出了基于缓存的优化 Token 使用的核心策略以及对何时使用新会话提出了场景。
大语言模型在每次处理新消息时都需要从头读取完整的输入内容,包括固定的系统指令、对话历史和新消息。随着对话轮次增加,Token 会越来越多。这里就涉及到了模型的提示缓存机制:当后续请求的输入前缀完全相同时,可以直接使用缓存,其成本仅为重新计算的十分之一。因此,在同一个活跃会话中持续工作,能保持高缓存命中率,显著降低成本。相反,频繁使用 /clear 或开启新会话会重置前缀,导致缓存失效,触发全价上下文重建,反而更费钱。
基于此,作者给出了省钱策略和具体操作规则。在缓存仍有效(通常1小时内)、任务未切换时,应继续当前会话;仅在任务更换、闲置超时或上下文充满无关噪音时,才开新会话。
也建议看看 Tw93 的 你不知道的 Claude Code:架构、治理与工程实践 其中也有类似的上线实践策略。

2、使用 Claude Code:会话管理与 100 万 上下文[^9]
标签:Claude,AI
依旧是宝玉老师关于上下文管理的文章,介绍了 Claude Code 在升级至 100 万词元上下文窗口后,如何通过有效的会话管理策略来优化使用体验。核心在于理解并主动管理上下文窗口,以避免因信息过载导致的模型表现下降,即上下文衰减。其中五种关键的上下文管理操作:继续、回溯、清空、压缩和子智能体。
在最后给出了操作的速查表。推荐结合前面的 Token 管理的文章一起看。

3、How I run multiple $10K MRR companies on a $20/month tech stack[^10]
标签:Life,思考
自打订阅了 AI 工具后,也开始关注起了成本问题(当然去年也做了一波 cost down 的工作)。本文中作者主张无需臃肿的框架,仅使用极简的 Go 语言代码和基础服务器,就能以每月 20 美元的低成本技术栈,支撑多个达到月经常性收入 1 万美元的公司。
整个核心在于技术栈、硬件配置、资源管理等综合的考虑,从而以最低的运营开销实现可观的业务规模。

4、Do You Even Need a Database? - DB Pro Blog[^11]
标签:database
数据库本质上是文件操作。文章通过对比文件直读、内存加载、磁盘二分查找等多种数据读取策略,并与SQLite 进行基准测试,强调了在多数应用场景下,传统数据库并非必需。
很多时候确实如此,比如自己做的前端应用或者很小的工具应用。完全就可以使用类似 JSON 文件代替数据库。现代硬件下,小规模的数据完全不会有任何问题。数据库更多的场景是在需要对数据有很强准确性要求的场景中(比如需要事务、锁)。
其他
1、在 AI 时代,我是如何深入学习一个技术领域的 - Tw93[^2]
标签:AI,思考,自律
Tw93 分享他在 AI 时代深入学习技术领域的方法。他强调了输出的重要性,学习的核心在于输出,只有能清晰阐述、整理并发布的内容才真正属于自己。
然后列举他自己具体学习过程被系统化组织。首先收集高质量资料,接着进行阅读筛选,对复杂的内容借助 Claude 理解或翻译;代码尽量运行或分析结构。目标是对领域建立真实认知,不追求掌握每个细节,筛选后通常只剩一半内容。然后撰写文章大纲,明确结构、资料来源和受众需求,再填充内容形成初稿,最后利用 AI 优化逻辑、精简表述并修补漏洞,但始终由自己主导修改和定稿。
输出确实非常重要,看过做过并不一定真的掌握。只有能讲给别人听,才是真的掌握。也不要因为没有读者就不去做输出,只要内容有一点点价值,自然就会有读者。这一点也是我在做公众号感受最深的地方。
最后借用作者的观点:
AI 在你有真实产出的时候才最有用。如果只是让它帮你总结,很容易感觉自己学了很多,但脑子里其实没什么扎实的。当你认真在写一篇东西、解释一个概念、做出一个成品的时候,AI 才真正有帮助,它放大的是你自己已经在做的事情。
2、为什么你的"AI 优先"战略可能大错特错?[^3]
标签:AI,思考
宝玉老师的文章,认为盲目推行“AI 优先”战略可能是错误的。AI 时代下人是反而成为了“瓶颈”。没有与之配套的工具或者工作流,只是将 AI 工具强行嵌入现有工作流,反而会让人工作得更累。
我自己工作中很明显的感受就是,AI 加快了开发过程。但 CI/CD、任务管理流程没有跟上,反而增加了 DevOps 同事的压力。因此,比起 “AI 优先” 不如重新梳理现有工作流,借助 AI 打造出合适的工具。
也正如作者的观点:
AI 优先战略的真正价值,或许不在于让 AI 包办一切,而在于借此契机推动一直难以落地的工程改进。AI First 的终点未必是让 AI 干所有的活,而是借着这股力量,把你一直想做但没动力做的工程改进,真正推动起来。 成功的关键在于搭建好工程基础,而非仅仅购买 AI 工具。

3、小猫咪也有自己的规划[^6]
标签:思考,Life
作者曾介绍自家小猫是一个有边界感且清醒的生命体。最近发现这只橘猫展现出一种违背直觉的特质:极其擅长规划。在使用自动喂食器并减少投喂频率后,作者发现猫的体重不降反增。经过观察,触发了它隐藏的行为机制:它现在竟然学会了利用单次出粮的分量进行分餐。当粮食落下后,它不再一扫而空,而是先只吃一部分,将剩余粮食分多次吃完。
这种对抗本能、进行资源规划的行为,跳出了单纯的生物性逻辑。作者认为,小猫在独处中摸索出了一套最符合自身利益的生存哲学,这种近乎冷酷的自我管理和对欲望的延迟满足,展现了一种高级的生命智慧,使其显得比预想的更为深沉。

4、Vibe Coding 是中年男人的钓鱼[^7]
标签:AI,思考
依旧是宝玉老师的文章,这篇不讲技术讲心理。AI 编程(Vibe Coding)对许多中年男性而言,其心理功能类似于钓鱼,是一种合法且体面的独处方式。中年男性常被多重社会角色(如职场经理、丈夫、父亲)包围,个人时间稀缺。
钓鱼时,一句“我在钓鱼呢”便能构筑屏障,保护一段名正言顺的孤独时光。Vibe Coding 在深夜家人入睡后发生,用户只需向 AI 描述需求,即可见证代码生成与项目运行,其过程带来的快感与鱼竿猛然一沉的感觉如出一辙。过程中那种我说了算的稀缺感受对中年人尤为宝贵。AI 把这一切的门槛踩到了地板上,让背负生活压力、缺乏时间精力的中年人得以跳过繁琐学习,直接抵达创造的核心,重获久违的成就感。
最终,鱼是否上钩或代码能否上线已不重要,重要的是这一刻,是真正属于我的。

5、情绪上的事儿,不要急着下结论[^8]
标签:Life,思考
作者自称急性子,情绪来得快、表现剧烈,但过去后便觉得事情并无实质影响。近一年,他尝试从这种模式中走出来,追求更平稳的情绪状态。本文通过室友的经历再次探讨这一话题。
室友独自入住一家民宿,起初非常满意:设施齐全、氛围亲切,像回到自己家一样温暖。然而第二天早上,她因一碗额外收费的面条和凉硬的青团感到不悦。作者借此指出,人的情感评价体系并不稳定——从像家一样温暖到青团好凉好硬,中间只隔了一个晚上。情绪往往只代表当下的瞬间感受,若拉长时间线,当初强烈的结论可能站不住脚。等情绪降温后再审视,许多烦心事可能只是微不足道的小波澜。别让一时的情绪影响对生活整体的判断,这是需要练习的基础心理防御。

工具
标签:Tools,JavaScript
micro-ml 是一个用于 JavaScript 的轻量级机器学习库,包含 16 种算法,压缩后体积约为 56KB。并且无外部依赖,可以在浏览器和 Node.js 环境中使用。
与 TensorFlow.js 等库相比,micro-ml 在体积和速度上具有优势。其介绍是“在分析趋势时,你未必需要 TenSorFlow”。它支持通过 Web Workers 处理超大数据集,避免阻塞主线程。

2、wesbos/JSON-Alexander: A really good JSON viewer browser Extension[^5]
标签:Tools,JavaScript,前端
这是一个名为 JSON Alexander 的浏览器扩展项目,其核心功能是作为一个优秀的 JSON 查看器。为 JSON 格式数据提供了语法高亮、层级控制、悬停查看 JSON 路径等功能。

参考文章:
- [1] Claude Code 省 Token 指南:慎用 1M 上下文,不开新会话或者总是开新会话都不对: https://baoyu.io/blog/2026-04-06/claude-code-token-optimization
- [2] 在 AI 时代,我是如何深入学习一个技术领域的 - Tw93: https://tw93.fun/2026-04-06/learn.html
- [3] 为什么你的"AI 优先"战略可能大错特错?: https://baoyu.io/blog/2026-04-13/ai-first
- [4] AdamPerlinski/micro-ml: Tiny ML & statistics library for JS — 16 algorithms in ~56KB gzipped. Rust/WASM, zero dependencies.: https://github.com/AdamPerlinski/micro-ml
- [5] wesbos/JSON-Alexander: A really good JSON viewer browser Extension: https://github.com/wesbos/JSON-Alexander
- [6] 小猫咪也有自己的规划: https://blog.solazy.me/20260414/
- [7] Vibe Coding 是中年男人的钓鱼: https://baoyu.io/blog/2026-04-14/vibe-coding-and-fishing
- [8] 情绪上的事儿,不要急着下结论: https://blog.solazy.me/20260415/
- [9] 使用 Claude Code:会话管理与 100 万 上下文: https://baoyu.io/translations/claude-code-session-management
- [10] How I run multiple $10K MRR companies on a $20/month tech stack: https://stevehanov.ca/blog/how-i-run-multiple-10k-mrr-companies-on-a-20month-tech-stack
- [11] Do You Even Need a Database? - DB Pro Blog: https://www.dbpro.app/blog/do-you-even-need-a-database
