Tasks

Step-by-step instructions for performing operations with Kubernetes.

Edit This Page

集群故障排除

本文档描述如何排除集群故障;这里我们假设您已经排除根本原因是因为您的应用程序导致的。有关应用程序调试的提示,请参阅 应用程序故障排除指南。 您也可以访问 疑难解答文档 以获取更多信息。

列出您的节点

在集群中调试的第一件事是确认您的节点是否都已正确注册。

运行

kubectl get nodes

并验证您期望的所有节点都存在,并且它们都处于 就绪 状态。

查看日志

目前,深入挖掘集群问题需要登录对应的机器。以下是相关日志文件的位置。(请注意,在基于 systemd 的系统上,您可能需要使用 journalctl 来代替)

Master

工作节点

集群故障模式的总体概述

这是一个可能出错的事件列表(列表并没有包含所有错误),以及如何调整集群设置以解决问题。

根本原因:

特定场景:

解决方法:

Analytics

Create an Issue Edit this Page