Work Summary
过去两周(1834 条记录)主要集中在以下几个领域:
RSSHub 路由开发与飞书集成(367 条):构建了完整的 RSS 信息聚合流水线,包括自定义 RSSHub 路由开发、AI 内容分类(AI Summer/AI Category Gate)、飞书多维表格自动同步。将 Go 版本的 info2feishu 服务从 100.64.0.1 迁移到 31.68,优化了定时任务和数据同步逻辑。
ESXi VMDK 工具开发(186 条):开发了跨平台 VMDK 磁盘分析工具,支持 Windows/Linux 虚拟机磁盘的读取和导出。解决了稀疏磁盘、快照链、多分区格式(NTFS/ext4)的兼容性问题。增加了完整的单元测试覆盖。
试卷格式化工具(184 条):构建了基于 AI 的试卷解析和格式化系统,处理 Word 文档中的复杂排版(选项横排/竖排、图片、表格)。解决了 JSON 解析、批次处理、前端展示等问题。
K8s 集群运维(165 条):处理了 itdrasz 项目的 K8s IP 更换、弱密码检测脚本优化、k3d 快速部署环境搭建。排查了 exec/logs 执行失败、SSH 连接等问题。
Improvement Areas
1. AI 工具链的系统性掌握
现象:频繁在 Claude/MCP/Gemini 等工具间切换,配置问题反复出现(如 mcp-hub 配置、ENABLE_TOOL_SEARCH 参数)。
根因:AI 工具生态快速演进,缺乏系统性的工具链知识体系,依赖试错而非文档驱动。
行动项:
- 建立 AI 工具链知识库,记录各工具的适用场景和配置要点
- 每周花 30 分钟阅读 Claude Code/MCP 更新日志
- 将常用配置固化为脚本,减少手动操作
2. 虚拟化底层知识补强
现象:VMDK 工具开发中多次遇到磁盘格式、分区表、文件系统的兼容性问题,需要反复搜索和试错。
根因:对 VMware 虚拟化底层(VMDK 格式、稀疏磁盘、快照机制)理解不够深入。
行动项:
- 阅读 VMware VMDK 官方规范文档
- 整理 VMDK 格式速查表(monolithicSparse/vmfsSparse/twoGbMaxExtent 等)
- 将调试经验沉淀到项目 README
3. 文档处理自动化能力
现象:试卷格式化项目中,Word 文档解析和排版问题占用大量时间,AI 返回格式不稳定。
根因:对 python-docx 库和 Word 文档结构理解不足,AI prompt 设计不够健壮。
行动项:
- 建立 Word 文档排版规则库(字体、段落、表格样式)
- 设计更结构化的 AI prompt,增加输出格式校验
- 考虑使用 Pandoc 作为中间格式转换层
4. 运维脚本的可观测性
现象:K8s 运维和数据同步任务中,问题定位依赖手动排查,缺乏系统性的日志和监控。
根因:脚本开发重功能轻可观测性,错误处理不够完善。
行动项:
- 为关键脚本增加结构化日志输出
- 建立运维脚本的健康检查机制
- 考虑引入简单的告警通知(Telegram/飞书)
Strengths
- 工具整合能力:成功将 RSSHub + AI 分类 + 飞书多维表格串联成完整的信息流水线
- 跨平台开发:VMDK 工具同时支持 macOS 本地和 Linux 远程执行
- 问题解决韧性:面对复杂的格式兼容性问题,能够持续迭代直到解决
- 自动化意识:主动将重复性工作(RSS 聚合、报告生成)自动化
Action Items
- P0 - 整理 VMDK 工具的测试用例覆盖范围,补充边界场景
- P0 - 完善 RSSHub 路由的 AI 分类准确率,增加人工反馈机制
- P1 - 建立 AI 工具链配置的版本管理,避免配置漂移
- P1 - 为试卷格式化工具增加输出格式校验层
- P2 - 学习 VMware VMDK 规范,输出技术笔记
Tech Trends
今日 HackerNews 热门技术话题精选。
1. One Human + One Agent = One Browser From Scratch in 20K LOC
Points: 194 | Comments: 97
一个开发者在 72 小时内使用 Rust(零第三方依赖)构建了功能完整的 HTML/CSS 浏览器。工作流程是人类负责决策和方向,AI Agent(Codex)负责实现。通过截图反馈循环,Agent 学习如何渲染真实网站。
最终产出约 20,000 行代码,跨 72 个文件。核心洞察是"一个人配一个 Agent 比一个人配一千个 Agent 更有效"——持续专注于单一代码库比分布式多 Agent 方法更高效。
Key Takeaways:
- 人机协作的关键是人类把控方向,Agent 负责执行
- 视觉反馈循环(截图对比)是有效的迭代方式
- 深度专注单一项目优于广度分散
2. AI2: Open Coding Agents (SERA)
Points: 159 | Comments: 22
AI2 发布了 SERA(Soft-verified Efficient Repository Agents),一系列开源编码模型。SERA-32B 在 SWE-Bench Verified 上达到 54.2%,训练成本仅需 40 GPU 天(约 $400),比竞品便宜 57 倍。
核心创新包括:软验证生成(接受部分正确的补丁)、51 种 bug 类型分类、高保真工作流模拟。支持在私有代码库上微调,8000 个样本即可让 32B 模型匹配 100B+ 参数的教师模型。
Key Takeaways:
- 开源编码模型正在快速追赶闭源方案
- 软验证策略降低了训练数据的质量门槛
- 小模型 + 领域微调可能是企业落地的最佳路径
3. AISLE Discovered 12 out of 12 OpenSSL Vulnerabilities
Points: 142 | Comments: 87
AISLE 使用自主 AI 分析发现了 OpenSSL 2026 年 1 月发布的全部 12 个 CVE,其中 5 个的修复方案被直接采纳。这些漏洞涉及 CMS、QUIC、后量子签名等子系统,部分已存在数十年。
更重要的是,AISLE 还发现了 6 个在发布前就被修复的问题——从被动打补丁转向主动预防。这标志着安全审计从人工驱动向 AI 辅助的范式转变。
Key Takeaways:
- AI 安全审计可以发现人工审查遗漏的漏洞
- 持续自动化分析比周期性人工审计更有效
- 关键基础设施的安全保障方式正在改变
4. Doing the Thing is Doing the Thing
Points: 319 | Comments: 111
Prakhar Gupta 的文章直击要害:思考、计划、看教程、买工具、甚至为不行动而内疚——这些都不是"做事"。真正的进步是开始行动,哪怕做得很差、很慢、只完成一部分。
"Failing while doing the thing IS doing the thing. Doing it badly IS doing the thing."
Key Takeaways:
- 不完美的行动胜过完美的计划
- 准备阶段的优化是一种拖延
- 开始比完美更重要