以问答方式整理 SLO + error budget + multi-burn-rate 告警的工程实现:为什么传统阈值告警容易噪声大或滞后、burn rate 14.4× 和 6× 数字怎么来,以及 Prometheus recording rules 与 alert 可以怎么落地。
Posts for: #k8s
软件供应链最小基线:SBOM + cosign 镜像签名
以问答方式拆解软件供应链最小基线:用 CycloneDX 生成 SBOM、用 cosign keyless 签名容器镜像、把 SBOM 作为 cosign attestation 绑定到镜像。覆盖为什么、具体怎么做、以及绕不开的 tradeoff。
K8s CPU 配置实践笔记:QoS、Throttling 与驱逐策略
结合 Homelab 场景整理 Kubernetes 的 CPU requests/limits、CFS throttling、QoS 类别与节点压力驱逐机制,以及我当前采用的资源配置思路。
postgresql在prometheus stack中没有采集到metrics的排查
我在homelab的k8s集群中使用helm部署了postgresql,但是prometheus stack没有采集到postgresql的指标数据。怎么排查这个问题呢?
使用helm添加observability需要的服务
已经在homelab搭建了microk8s集群,需要使用helm为集群添加observability功能,包括prometheus、grafana、loki和tempo等组件。
使用Terraform和Ansible创建K8s集群
使用Terraform和Ansible在proxmox的虚拟机上创建K8s集群。