×
思维导图备注
Kubernetes 实践指南(Kubernetes Practice Guide)
首页
下载
阅读记录
书签管理
我的书签
添加书签
移除书签
问题排查
浏览
968
扫码
分享
2020-01-07 20:58:56
问题排查
问题排查
Pod 排错
网络排错
集群排错
经典报错
其它排错
上一篇:
下一篇:
概览
本章小结
相关工具
简介
小结
序言
部署指南
手工部署
部署 ETCD
部署前的准备工作
部署 Master
部署 Worker 节点
部署附加组件
部署 CoreDNS
常见应用部署
以 Daemonset 方式部署 kube-proxy
ElasticSearch 与 Kibana
集群方案
使用 elastic-oparator 部署
网络方案
Flannel
部署 Flannel
Containerd
运行时方案
安装 containerd
Nginx Ingress
Ingress 方案
安装 nginx ingress controller
Traefik Ingress
Metrics 方案
安装 traefik ingress controller
安装 metrics server
最佳实践
服务高可用
本地 DNS 缓存
泛域名动态转发 Service
集群权限控制
利用 CSR API 创建用户
控制用户权限
控制应用权限
实用工具和技巧
kubectl 高效技巧
实用 yaml 片段
实用命令与脚本
证书管理
安装 cert-manager
使用 cert-manager 自动生成证书
集群配置管理
Helm
安装 Helm
Helm V2 迁移到 V3
排错指南
大规模集群优化
问题排查
Pod 排错
Pod 一直处于 Pending 状态
Pod 一直处于 ContainerCreating 或 Waiting 状态
Pod 一直处于 CrashLoopBackOff 状态
Pod 一直处于 Unknown 状态
Pod 一直处于 Terminating 状态
Pod 一直处于 Error 状态
Pod 一直处于 ImagePullBackOff 状态
Pod 一直处于 ImageInspectError 状态
容器进程主动退出
Pod 健康检查失败
LB 健康检查失败
网络排错
DNS 解析异常
Service 不通
Service 无法解析
集群排错
网络性能差
Node 全部消失
Daemonset 没有被调度
经典报错
arp_cache: neighbor table overflow!
no space left on device
Cannot allocate memory
其它排错
Job 无法被删除
kubectl 执行 exec 或 logs 失败
处理实践
内核软死锁
高负载
磁盘爆满
内存碎片化
inotify watch 耗尽
PID 耗尽
arp_cache 溢出
cgroup 泄露
踩坑总结
tcp_tw_recycle 引发丢包
使用 oom-guard 在用户态处理 cgroup OOM
案例分享
驱逐导致服务中断
DNS 5 秒延时
跨 VPC 访问 NodePort 经常超时
arp_cache 溢出导致健康检查失败
访问 externalTrafficPolicy 为 Local 的 Service 对应 LB 有时超时
Pod 偶尔存活检查失败
LB 压测 NodePort CPS 低
Pod 访问另一个集群的 apiserver 有延时
kubectl edit 或者 apply 报 SchemaError
排错技巧
容器内抓包定位网络问题
分析 ExitCode 定位 Pod 异常退出原因
使用 Systemtap 定位疑难杂症
Go 语言编译原理与优化
暂无相关搜索结果!
本文使用
EduBoo.COM
构建
×
分享,让知识传承更久远
×
文章二维码
手机扫一扫,轻松掌上读
×
文档下载
请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
PDF
文档
EPUB
文档
MOBI
文档
×
书签列表
×
阅读记录
阅读进度:
0.00%
(
0/0
)
重置阅读进度