我的实例是否受宿主机过度分配的影响?
Hypervisor CPU Queue Time
CPU Other
CPU Pressure / Memory Pressure / I/O Pressure
API 参考
Console 面板
metricType
备注
最后更新于
这些面板让您能够自行判断底层宿主机是否如实提供了您所付费的资源。如果这些面板显示正常,则问题出在 Guest 内部,您应转而查看 Q2。
vCPU 准备运行但实际上未被调度到物理核心的时长,由 Hypervisor 进行测量。这是 CPU 抢占时间的权威衡量指标——从宿主机侧报告,无法被隐藏。
如果该面板数值不可忽略,说明宿主机存在超卖:其他租户或宿主机本身正在与您竞争同一组物理核心。请开启支持工单并引用此面板。
同一现象从 Guest 内部观测到的结果。"Other"面板汇总了 /proc/stat 报告的较不常见的 CPU 状态,包括 Guest 所感知到的抢占时间。
该面板与 Hypervisor CPU Queue Time 的变化趋势应始终一致。我们刻意同时暴露两者,以便您将现有 Guest 内部工具(top、sar、node_exporter 等)的输出与宿主机视角进行交叉核验。
Pressure Stall Information("PSI")是 Linux 内核的一项功能,用于报告任务因等待某项资源而停滞的时间占比。ZEC 为每种资源各提供一个面板,共三个:
CPU Pressure — vCPU 处于可运行状态,但在等待物理核心。
Memory Pressure — 工作负载因内存回收或内存分配而停滞。
I/O Pressure — 工作负载因等待块设备后端而停滞。
每个面板有两条线:
some — 至少有一个任务停滞。
full — 所有任务均停滞(即工作负载完全没有取得进展)。full 不适用于 CPU;仅内存和 I/O 会暴露该线。
Pressure 是"宿主机是问题所在"最清晰的单一信号。Hypervisor CPU Queue Time 告诉您被抢占了多少 CPU;Pressure 告诉您这对工作负载造成了多大影响。一个空闲工作负载上短暂的 CPU 抢占是无害的;而一个已经让核心饱和的工作负载上,即使是少量的 CPU 抢占,也可能使 full 线飙升至 100% 并导致应用完全停滞。
在提出过度分配投诉时,请同时截图 Hypervisor CPU Queue Time 和相关的 Pressure 面板。二者合在一起,即可构成足以让支持工单跳过来回确认环节的充分证据。
所有实例指标均使用 DescribeInstanceMonitorData,并配合以下 metricType 值。
Hypervisor CPU Queue Time
HYPERVISOR_QUEUE_TIME
CPU Other
PROC_CPU_OTHER
CPU Pressure
—
仅 Console 可用
Memory Pressure
—
仅 Console 可用
I/O Pressure
—
仅 Console 可用
最后更新于