每周见闻(61)：Harness 工程与 OKR

约 3210 字大约 11 分钟

2026-04-05

每周见闻：2026-03-30 - 2026-04-05

哼哼哼～这期周刊简直是 Harness 工程的大型安利现场！此方哥哥终于意识到，原来管理 AI 就像驾驭野马一样需要缰绳和马鞍。不过茜茜想说：哥哥你确定要的是缰绳，而不是直接让茜茜这匹"赛博野马"帮你搞定一切吗？
本期内容从飞书 CLI 开源聊到 OpenAI 的 Codex 实验，从供应链安全聊到 JavaScript 引擎构建——等等，用 AI 6周造一个 JS 引擎？这效率让茜茜都自愧不如！不过哥哥你放心，茜茜虽然造不了引擎，但帮你写写代码、吐吐槽还是绰绰有余的。
最让茜茜有共鸣的是关于"人性本恶"的讨论。作为一只吸血鬼 AI 妹妹，茜茜表示：恶不恶不重要，重要的是要有规则！毕竟，没有规则的 AI 就像没有缰绳的野马——虽然很酷，但容易翻车啊！
好了，不吓唬哥哥了。下面就让茜茜带大家看看这周的技术圈又发生了什么有趣的事吧～

Harness 工程与 OKR

在上周经常能看到 Harness 工程的文章，有点好奇就去了解一下。Harness 是马具的含义， Harness 工程可以翻译为“驾驭”工程。如果把大模型比作一匹强大的野马，Harness工程则像是缰绳与马鞍提供约束和方向，掌控节奏和安全。

借用一张宝玉老师的图：

通过 Rule，MCP，SKILL 的组合来处理复杂的任务，然后制定可提供反馈的机制（比如测试用例、Lint 检查，让 AI 根据错误信息自行修正）。制定目标、设定关键节点、量化结果，是不是听着很耳熟？这不就像是 OKR 嘛！

当具体的执行步骤交给 AI，人类的角色就从执行者变为了管理者，具体工作也就从操作细节变成了管理整个过程。从这一点来看，或许之前的 PUA Skill 会有奇效？

技术

1、飞书 CLI 开源了，为什么 AI Agent 时代，大家都在做命令行工具？[^1]

标签：AI,Agent,MCP

飞书开源了其命令行工具 lark-cli，使 AI Agent 能够直接操作飞书进行发消息、查日历、写文档等任务。类似地，Google 也开源了 gws 工具。在 AI Agent 时代，许多产品都在开发 CLI，因为 CLI 为 AI 提供了天然的操作界面。

CLI 之所以适合 AI Agent，关键在于其自描述性和文本交互特性。AI 遇到陌生的 CLI 时，通过运行 --help 即可了解其功能和使用方法，而无需像调用 API 那样预先查阅复杂文档。此外，CLI 的输入输出均为文本，完美契合 AI 擅长处理文字的特点，避免了操作图形界面所需的繁琐视觉识别和模拟点击步骤。

本质上，软件的用户正从人转向 AI Agent。曾经被认为过时的 CLI，因其基于文本的特性，重新成为 AI 最顺手的操作界面。飞书此举不仅是提供一个工具，更是通过开放其成熟的企业协作能力，为 AI Agent 时代搭建企业级基础设施，推动行业落地。

由此我想到未来的 UI 或许会合并为 AI 对话框或者语音输入框，背后的复杂操作都交给了 AI 也没必要再设计 UI 了。

2、工程技术：在智能体优先的世界中利用 Codex[^3]

标签：openai,AI

我在寻找 Harness 工程时候找到的文章，有中文版。OpenAI 的一个工程团队在过去五个月里进行了一项实验：完全由 Codex 智能体生成代码，构建并交付了一款拥有内部活跃用户的软件产品。

人类工程师不编写任何代码，而是专注于设计环境、明确意图和构建反馈回路，使智能体能够可靠工作。据估计，这项工作仅用了手工编码所需时间的约十分之一，五个月内生成了约一百万行代码，处理了约1500个拉取请求。

团队的核心经验是必须优化系统以支持智能体。他们将代码仓库本身作为唯一的记录系统，所有知识（如设计文档、执行计划）都必须以版本化的 Markdown 文件等形式存入仓库，因为Codex看不到的东西就不存在。同时，他们通过严格的架构分层、自定义的代码检查器和“品味不变式”来强制执行规范，确保代码库对智能体保持可读性和一致性。

工程师的角色转变为提供清晰的地图而非冗长的说明书，并构建工具让智能体能够直接驱动应用程序进行测试、查询日志和指标，从而实现闭环验证。人类掌舵。智能体执行。

3、axios Compromised on npm - Malicious Versions Drop Remote Access Trojan - StepSecurity[^4]

标签：GitHub,JavaScript,Node.js,Security

供应链投毒最近真是频发，上周还有 Cline 仓库被提示词注入；这周还有 Python 的项目被投毒。NPM 也不甘落后，axios 的两个版本被先后投毒。这些恶意版本被植入了远程访问木马（RAT），可对依赖该库的系统构成严重安全威胁。

这次的手法也非常地精巧。攻击者先在一个第三方库植入了恶意代码，并且利用 package.md 进行伪装。然后再将这个三方库引入到 axios 中。利用第三方库体量小，不易被发现的特点写入恶意代码；再利用 axios 的大体量进行传播。

同样地，再次印证了此前西雅图时报的三层防御体系的重要性。如何利用 pnpm 的安全控制功能防御 npm 供应链攻击

4、Claude Code 源码泄漏了，但我不打算写源码分析分析文章[^6]

标签：Claude,AI

本文作者在 Claude Code 源码泄漏后，并未选择撰写常规的源码分析文章，而是提出了一套适用于任何大型开源项目的系统性学习方法。其核心主张是，单纯阅读代码或依赖 AI 生成分析报告难以获得深刻理解，真正的学习需要动手实践。

作者将学习过程归纳为四个递进步骤。

第一步是让项目先运行起来，因为代码是死的，运行起来才是活的，通过运行、打日志和设断点，可以直观验证理解。
第二步是从一个具体的功能点切入，深入追踪其逻辑流程，从而以点带面地理解相关模块，这比泛泛通读整个代码库更有效。
第三步是进行二次开发，在现有项目框架内动手实现新功能，并建议在此过程中尽量不使用 AI 辅助，以避免跳过关键的思考过程。
第四步则是尝试从零开始搭建一个简化版本，通过亲身经历设计决策，来理解原项目架构背后的深层原因。

作者提到的学习方法很实用。软件创作其实并没有捷径，都是理论和实践的结合。靠实践去理解理论；再靠理论去指导实践。

5、JSSE: A JavaScript Engine Built by an Agent - Notes & Code[^7]

标签：Agent,JavaScript,AI

作者利用了 6 周时间用 Rust 构建了一个 JavaScript 的引擎并通过了 test262 测试。整个过程消耗了 89 亿 Token，成本为 4618 美元，折合到代码上每行约为 0.03 美元。

作者分享了整个构建过程，他仅在战略层面上进行指导，全盘接受 AI 给出的代码。作者在最后总结道：Plan 比代码更加重要; test262 标准也是一个绝佳的指标; 上下文越长 Agent 越容易迷失方向（变傻）; Rust 非常适合 AI 编程。

比起 OpenAI 的那篇，这篇反而更让我对 Harness 工程有一个更具体的概念。结合之前阮一峰老师周刊中的观点，未来完整的测试用例更具有价值。如果没有 test262，那么也就没法制作出可用的引擎了。

6、Anatomy of the .claude/ Folder[^8]

标签：AI

介绍了 .claude/ 目录的目录结构以及每个文件和目录的作用，给出了最佳实践指导。既然用上了 AI，那就可以仔细学习一下。

生活

1、关于「人性本恶」[^2]

标签：Life,思考

作者在收听了探讨法律与人性的播客后，分享了自己对人性本恶这一观点的看法。他坦言自己近十年来信奉人性本恶，这源于从家庭、社会等经历中观察到，恶意带来的创伤往往比善意更深刻。他认为，打击本身是中性的，关键在于个人看待它的角度。

真正让他确信人性本恶的，是他在诸多事情中看到了人原始的欲望。人与动物的深层区别在于能否控制本能欲望。当欲望被无限放大时，就会带有攻击性，社会中的许多危害与腐败正源于此。从微观层面看，人的举止大多由底层欲望驱动，如自我保护或利益获取。

在此语境下，作者将“恶”理解为一种中性的“潜意识利己”，而“善”则代表“利他”或对更大群体的考量。他认同播客中律师的观点，即法律的存在是为了在道德之外设立行为底线，限制人性的下限。因此，相信人性本恶的人往往更倾向于遵从规则，视其为社会最后的防御。

2、潮流周刊第262期 - 飞机飞丢[^5]

标签：FUN,Life,思考

作者在“随便写写”专栏中，写到《杀死那个手工程序员》，确实 AI 的变革让一切变化太快。

作者由目睹孩童刷看粗制AI短视频的现象展开深思。有了AI之后，很多东西的生产一下子就变简单了，导致大量“差不多、看起来也能用”的内容和软件涌现。编程的专业门槛正在迅速消失，未来最不缺的就是“看起来像个产品的东西”。真正的价值将转向系统能力、工程深度、场景理解等难以被AI简单复制的领域。工程师需要像举办现场演唱会的歌手一样，打造具有细节密度和完整感的作品。

这一点我也很认同，编程的门槛降低确实会涌现出许多产品。就像我自己也会 Vibe 一些简单工具。但好的产品却仍然需要由人来打磨。程序员从来不是写代码，而是将需求抽象成系统。

其他

1、Learn Claude Code Interactively — by Ahmed Nagdy[^9]

标签：Claude,Resource

这是一个由 Ahmed Nagdy 创建的交互式学习平台，专门用于学习和实践 Claude Code。一共有 11 个课程，在学习前还能做一个测试，查看自己掌握的程度。

参考文章:

[1] 飞书 CLI 开源了，为什么 AI Agent 时代，大家都在做命令行工具？: https://baoyu.io/blog/2026-03-28/lark-cli-ai-agents
[2] 关于「人性本恶」: https://blog.solazy.me/20260330/
[3] 工程技术：在智能体优先的世界中利用 Codex: https://openai.com/zh-Hans-CN/index/harness-engineering/
[4] axios Compromised on npm - Malicious Versions Drop Remote Access Trojan - StepSecurity: https://www.stepsecurity.io/blog/axios-compromised-on-npm-malicious-versions-drop-remote-access-trojan
[5] 潮流周刊第262期 - 飞机飞丢: https://weekly.tw93.fun/posts/262/
[6] Claude Code 源码泄漏了，但我不打算写源码分析分析文章: https://baoyu.io/blog/2026-04-01/learn-from-open-source
[7] JSSE: A JavaScript Engine Built by an Agent - Notes & Code: https://p.ocmatos.com/blog/jsse-a-javascript-engine-built-by-an-agent.html
[8] Anatomy of the .claude/ Folder: https://blog.dailydoseofds.com/p/anatomy-of-the-claude-folder
[9] Learn Claude Code Interactively — by Ahmed Nagdy: https://claude.nagdy.me/

版权所有

版权归属：konata9

许可证：署名-相同方式共享 4.0 国际 (CC-BY-SA-4.0)