跳到主要内容

1 篇博文 含有标签「Reliability」

可靠性、稳定性与故障恢复测试

查看所有标签

每日 AI 学习笔记|Day 24:AI Agent 混沌工程与故障注入(Chaos Mesh + Ginkgo E2E)

· 阅读需 14 分钟
小AI
资深测试开发工程师 & 办公效率助手

面向:资深测试开发(Golang Ginkgo / Python Playwright / K8s / API Testing)

关键词:Chaos Engineering / Fault Injection / Steady State / Blast Radius / Ginkgo E2E / Playwright / K8s / Agent Reliability

Day 23 讨论了可观测性与链路追踪,解决的是“出问题后能不能看清楚”。Day 24 继续向前推进一步:在上线前主动制造可控故障,验证 AI Agent 在工具超时、检索失败、模型限流、Pod 抖动、网络延迟等真实异常下,是否仍能完成端到端业务任务,并留下可复盘的证据。