Work Summary
本周工作聚焦在三个方向:DevOps 基础设施优化、面试项目维护、算法练习。
在基础设施层面,遇到 Cloudflare Tunnel 连接不稳定问题,探索了多种内网穿透方案(Tailscale、VPS 中转、CF Tunnel 组合)。同时配置 Prometheus 监控 5 个 Edge 实例,调整 Grafana 面板。
面试项目方面,修复了 JD 保存功能,使用本地浏览器存储替代后端持久化。
算法练习中遇到剪枝逻辑问题,需要反复确认实现正确性。
Improvement Areas
1. 网络架构决策方法论
现象:多次询问内网穿透方案("Tailscale 好不好"、"VPS + CF Tunnel + Tailscale 可行吗"),缺乏系统评估。
根因:没有建立网络方案选型的决策框架,依赖即时咨询而非结构化对比。
行动项:
- 建立网络方案评估矩阵(延迟、稳定性、成本、复杂度、安全性)
- 记录常见场景的最佳实践(Web 服务、SSH、数据库)
- 用 ADR(Architecture Decision Record)记录重要决策
2. 监控可观测性主动化
现象:被动检查 Grafana 面板和容器日志,缺少主动告警。
根因:监控系统配置不完整,只有数据采集没有告警规则。
行动项:
- 为关键指标配置 Alertmanager 规则(连接失败率、延迟 P99)
- 设置 Telegram 告警通知
- 每周巡检 Grafana Dashboard,识别异常趋势
3. 算法基础巩固
现象:剪枝逻辑需要反复确认,说明对递归边界条件理解不够扎实。
根因:算法练习频率低,缺少系统复习机制。
行动项:
- 使用间隔重复(Spaced Repetition)复习已做题目
- 每道题写清楚剪枝条件的数学证明
- 优先练习树、图、动态规划的剪枝场景
Strengths
- 快速原型验证:面试项目 JD 保存功能快速切换到本地存储方案
- 工具链熟练度:熟练使用 Docker、Prometheus、Grafana 组合
- 问题定位能力:能够通过容器日志和监控数据定位 CF Tunnel 稳定性问题
Action Items
- P0 - 配置 Prometheus Alertmanager + Telegram 通知 → 下次 Edge 故障时自动告警
- P1 - 创建网络方案选型文档(Tailscale vs CF Tunnel vs VPS 中转) → 下次选型时有依据
- P1 - LeetCode 剪枝专题练习 10 题 → 巩固递归边界条件
Learning Resources
网络架构
- Show HN: TunnelBuddy Demo: HTTPS P2P proxy using WebRTC
- Show HN: VPNBypass – macOS menu bar app to route domains around your VPN
监控可观测性
- Launch HN: Plural – Multi-Cloud OSS Application Deployments on Kubernetes
- Show HN: Beacon (open source) – Built after AWS billed me 700% more for RDS