May 27 2026
前段时间,部门leader交给我一个任务:公司SRE平台的工单系统已经累积了7019个人工工单,这些工单里沉淀了大量运维过程中的实际问题和解决经验,leader希望我能用这些数据建立一个SRE领域的专属知识库。
接到任务后,我初步盘算了一下,制定了一个看似顺理成章的计划:
- 把这7000多个工单全部格式化为Markdown文件,提取工单标题、内容、处理会话以及审批详情。
- 选型知识库的检索方案,在传统的 RAG(检索增强生成)和最近比较火的 LLM Wiki 之间做个抉择。
但随着项目的推进,我发现事情并没有那么简单。在这个过程中,我对“如何用大模型解决实际工程问题”又有了一些新的体悟,在这里复盘总结一下。
May 9 2026
最近有点忙,主要围绕着打造适合自己的 harness 工程来进行。在之前的《AI工程落地实践》的文章中,我已经基于 superpowers 构建了适合我们团队的 AI 开发工作流:
brainstorming ──→ writing-plans ──→ executing-plans ──┬──→ test-driven-development
└──→ code-review-expert ──→ learn
但是在这个流程的中间,我发现了一个问题:我需要多次跟 Agent 对话来确认进度,而 Cursor 是以请求次数计费的。这就导致每次开发需求我不仅需要频繁切入确认,还浪费了不少 Cursor 的高级模型请求次数。为了解决这个问题,我在现有的开发流程上增加了一个新的 go 启动 SKILL。
Mar 7 2026
前言
过去的两周,我经历了一次充满激情的开发,也经历了一次彻底的失败。
起因是我准备在内部做一个公共的“运维AI机器人”。我满怀热情地规划了多租户架构、复杂的并发控制、MCP(Model Context Protocol)对接以及各种内部系统的打通。然而,经过两周的爆肝,项目上线没多久就被平台团队勒令下线,而从业务价值来看,老板其实也并不需要这样一个东西。
俗话说,失败是成功之母。虽然项目黄了,但这两周踩过的坑、写过的废代码,都是技术架构演进路上的宝贵经验。我在这里复盘一下整个过程,聊聊我的技术实现、妥协,以及如果让我重新设计,我会怎么做。
Feb 11 2026
前几天在整理项目代码的时候,看着 commit log 里那些由 AI 生成的代码,突然有点感慨。以前写代码是体力和脑力的双重劳动,现在好像变成了单纯的脑力博弈——跟 AI 的博弈。
这篇想絮絮叨叨聊一下从传统的开发模式转变为 Vibe Coding 的过程中,我踩过的坑以及现在摸索出来的一套还算顺手的 SOP。
1. 回顾:前AI时代的手工作坊
在那时候,我接一个大需求,流程基本是雷打不动的:
- 拆解:把大需求掰碎了,变成一个个小任务。
- 设计:看老代码,定方案。哪里要改,哪里要加,脑子里或者纸上得有个谱。
- 搬砖:按计划写代码,写单测。
- 验证:跑通端对端流程。
- Code Review:提 PR,等同事挑刺,改代码,合并。
这个过程里,最重要的一步其实往往被忽视,就是复盘。这波开发里学到了什么新模式?引入了什么新坑?怎么避免下次再犯?这种“复利”思维才是工程师成长的关键。
Jan 4 2026
今天是2026年的第一个周日,窗外是珠海特有的温润海风。这一年,我从深圳到珠海,从一家迷茫的小公司到了老牌的金山办公。如果说2024年是本命年的阵痛,那么2025年对我来说,更像是在这激荡的技术浪潮中,努力寻找平衡与自洽的一年。
依然按照惯例,絮絮叨叨地复盘下我的2025吧。
行云创新:及时止损的教训
2025年的开头,我还在行云创新做云原生产品。当时做的是基于 K8s 的在线云 IDE,技术方案其实挺有意思:用 K8s 调度启动在线编辑器,用 code-server 和 selkies 暴露桌面 IDE,甚至还研究了 Docker Windows 容器。为了解决文件同步,我设计了 Sidecar 模式的文件服务,负责上传变更、初始化 git 目录这些活儿。
技术上虽然有成就感,但职场环境却让我第一次深刻体会到“庙小妖风大”。
先是内部莫名其妙的同事纠纷,随后是让人窒息的“服从性测试”。有一次我下班刚到家,就被领导一个电话叫回去值守,其实压根不是我的问题。最崩坏的是关于技术方向的讨论,领导要求我周末加班,把已经验证通过的方案改回到之前被废弃的死路上。我坚持了专业意见,并坦言周末搞不定,结果就是失去了所谓的“信任”。