在 Homelab K3s 集群中,通过部署 alertmanager_gotify_bridge 将 Prometheus Alertmanager 的告警推送到 Gotify,实现自托管消息通知。记录从 Vault 存储 Token、ESO 同步 Secret、到 Alertmanager 路由配置的完整步骤。
Posts for: #k3s
从 Cilium Gateway 到 CoreDNS:一次跨层级的 K8s 连锁故障排查
一次看起来像 Cilium Gateway Degraded 和 ArgoCD Sync 异常的故障,最后追到了 CoreDNS stub resolver、ZITADEL backend 缺失和 Vault 密钥问题。记录完整排查链路、修复动作和后续固化方案。
Cilium ClusterMesh 实战:连接两个 K3s 集群的跨云服务发现
记录在 homelab 和 Oracle Cloud 两个 K3s 集群上启用 Cilium ClusterMesh 的完整过程:从 homelab 集群重建、Cilium Gateway API 切换、Tailscale 组网,到 ClusterMesh 双向连接和跨集群可观测性验证。
Oracle Cloud K3s 迁移到 Cilium:一次把网络、密钥和状态数据都翻出来的升级
记录 oracle-k3s 从 Flannel 迁移到 Cilium 的完整过程:从 K3s 重装、Cloudflare Tunnel 的 QUIC 问题、Vault Secret 恢复,到 PVC 数据回灌和 Timeslot 修复,顺便总结哪些复杂度值得保留,哪些该延后。
K3s 集群 CNI 迁移实战:从 Flannel 到 Cilium 的踩坑记录
记录 homelab K3s 集群从默认 Flannel 迁移到 Cilium CNI 后遇到的三个典型问题:Cloudflared QUIC 握手超时、Pod 无法访问节点物理 IP、ZITADEL 密钥长度错误,以及各自的排查过程和解决方案。
Homelab 备份体系实践:Kopia + CronJob + GitOps 的一次落地记录
记录在双集群 K3s Homelab 中落地 Kopia 自动备份体系的过程:从数据分类、CronJob 设计、跨集群备份传输,到 GitOps 管理和灾难恢复 SOP。
K8s CPU 配置实践笔记:QoS、Throttling 与驱逐策略
结合 Homelab 场景整理 Kubernetes 的 CPU requests/limits、CFS throttling、QoS 类别与节点压力驱逐机制,以及我当前采用的资源配置思路。
Homelab OTel 实践:从日志采集到双集群全链路追踪
记录在双集群 K3s Homelab 中补齐 OpenTelemetry traces 管道的过程:从 OTel Collector 配置、跨集群 Tempo 接入,到 Grafana 数据源联动和多语言 SDK 接入。
我的 Homelab 架构梳理:双 K3s 集群的 IaC 与 GitOps 实践
整理当前这套 Homelab 的整体架构:从 Proxmox 和 Oracle Cloud 双集群,到 Terraform + Ansible、ArgoCD GitOps、Tailscale、Cloudflare、Vault 与 ZITADEL 的配合方式。
用 Cloudflare WAF 为双 K3s 集群补一层边缘防护
记录在 Homelab 的 Cloudflare Terraform 配置中补充 WAF 防护:Zone 安全设置、自定义规则和认证端点速率限制,用来保护 homelab 与 oracle-k3s 的子域名入口。