标签: xen

BUG:软锁定 - CPU# 卡住 x 秒

我已经看到了一些关于 nagging 的错误报告和问题(在 stackexchange 和其他地方)"BUG: soft lockup - CPU#<n> stuck for <dt>s!"。到目前为止,我还没有找到任何关于该做什么或尝试什么的线索(相反,我找到并遵循的线索并没有阻止这种情况的发生)。我对此更加担心,因为:

  1. 这些事件的频率最近似乎在缓慢上升(每月超过 700 次),
  2. yum update 并重新启动使其慢了一段时间,但我看到一些锁定再次开始发生,
  3. 几个进程(如果不是整个主机,很难说),当然包括我所有的交互式 shell 在它发生时都被冻结了一段时间,
  4. 我不确定它是否相关,但我看到很多与 ntpd 无法更新时钟相关的日志/消息。

以下是摘录$(grep 'soft lockup' /var/log/messages*)

Mar 22 10:02:35 localhost kernel: BUG: soft lockup - CPU#15 stuck for 10s! [kjournald:1048]
Mar 22 10:02:36 localhost kernel: BUG: soft lockup - CPU#0 stuck for 10s! [postgres:5372]
Mar 22 10:02:36 localhost kernel: BUG: soft lockup - CPU#8 stuck for 10s! [postgres:5368]
Mar 22 10:02:37 localhost …
Run Code Online (Sandbox Code Playgroud)

centos xen amazon-ec2

34
推荐指数
1
解决办法
6万
查看次数

可怕的情况 - 文件系统由多个独立的操作系统实例同时挂载

我如何安全地摆脱这种情况?

详情如下:

xen 服务器已将块设备分配给 VM。但这些设备也已经安装在 Xen 中。

事实上,这些块设备中有 44 个是这样安装的。更糟糕的是,每个物理设备在 4 条路径上可见,并且每条路径都安装在单独的挂载点上。换句话说,每个设备实际上安装了 5 次。

VM 来宾操作系统通过 PowerPath 伪设备(作为 phy:块设备分配给 domU)查看路径

一些设备被格式化为 ext2 和 reiserfs。

无需向我解释这里涉及的文件系统损坏风险。

恐怕只是卸载文件系统也有可能造成损坏,觉得此时拔掉主机的电源,是最安全的选择

请注意,所有 VM 中的应用程序(大部分为 Oracle 数据库)仍在运行和使用中。

我在调查 dom0 上的高 CPU 使用率时发现了这一点。有一个无法杀死的“查找”进程,cwd -> /media/disk-12 从/dev/sdf1 挂载,属于/dev/emcpowerr

在有人问之前,我曾经见过进程无法被杀死并继续使用 CPU 和 RAM(与失效/僵尸进程不同)时,是当有未完成的提交 I/O,例如同步返回但尚未物理上磁盘时. 更常见的是,这发生在磁带 I/O 上。

建议!?

PS我希望设备在安装后被“保留”,以防止这种事情?或者这在 Linux 上是不可能的?

编辑:首先,我确信管理程序中的 KDE)是罪魁祸首。看起来 KDE 正在安装它可以在日志记录中创建桌面图标的设备。然而,同样的事情不会发生在其他 Xen 服务器上,但所有其他服务器都运行更旧版本的 SLES 和 KDE ...... V4 似乎是有问题的,3.4 表现更好)。

此外,两个非关键虚拟机已挂起。关闭它们后,由于文件系统损坏,它们将无法再次启动。主/生产虚拟机仍在运行,其上的数据库仍在运行,但显然这是一个定时炸弹。客户正尝试在另一台服务器上的另一台 VM 上重新构建环境,但在配置某些组件时遇到问题,因此我们正在等待...

无论如何,我觉得到目前为止没有一个答案不仅仅是“最佳实践总是优雅地关闭”而且我希望得到更具体的东西......无论如何,我觉得这种情况可能需要更加小心思维。关闭是否会导致未完成的 IO(特别是来自管理程序的文件系统元数据更新)同步并导致潜在的主要文件系统损坏?

filesystems unmounting xen disk

15
推荐指数
1
解决办法
1584
查看次数

监控窃取时间 (st) 的工具

我们在一个虚拟的“专用”服务器上运行,理论上,这应该意味着我们是服务器上唯一的人。在实践中......我想我们可能不会。

在此处输入图片说明

请注意,虽然看起来我们正在杀死我们的机器,但“窃取时间”为 71%

我正在对负载进行统计,但我很失望这个统计数据没有出现在我的图表中。是否有任何工具可以监控这一点可能会有所帮助?


附加信息:

我们正在运行 4 个内核,模型:

# grep "model name" /proc/cpuinfo | sort -u
model name  : Intel(R) Core(TM)2 Duo CPU     E7500  @ 2.93GHz
Run Code Online (Sandbox Code Playgroud)

top xen virtualization

12
推荐指数
2
解决办法
4543
查看次数

KVM 或 Xen 中的 GPGPU/CUDA

我们希望能够在 KVM 或 Xen(或 Citrix Xenserver)中直接访问支持 CUDA 的 GPU。具体来说,我们想使用 PCI passthrough 来访问一个 NVIDIA Tesla S2050 单元,它由 4 个 Tesla C2050 设备组成。我知道 Xenserver 5.6 支持启用 SLI 多操作系统的 GPU,但我的理解是 C2050 不是 SLI 多操作系统设备。由于我遇到的性能和维护问题,我宁愿避免类似 RPC 的解决方案。

Amazon EC2 提供带有 Tesla M2050 GPU 的 Xen VM,我相信它与我们的 C2050 非常相似,所以看起来我想做的事情应该是可能的。有没有人成功地将非 SLI 多操作系统 GPU 从 KVM 或 Xen 传递到 Linux VM 并成功运行 CUDA 应用程序?如果是这样,您使用了什么虚拟化解决方案以及使用了什么 GPU?

kvm nvidia xen

9
推荐指数
1
解决办法
7032
查看次数

设置 KVM/Xen 盒的好教程以及关于哪个更好的建议

我有一台双 xeon、2GB、75GB 高清服务器,我想把它变成我的专用虚拟环境。目前我在本地使用 VirtualBox 为 Cassandra 和 Nginx/Haproxy 运行一个模拟集群,但它开始使我的系统过载。我想为这个机器运行 Arch,并有一个最小的桌面环境,KVM 或 Xen 管理所有的 VM。任何人都知道一个很好的教程,还是我应该只安装基本架构然后找到一个很好的教程来设置 Xen/KVM 和管理机器?此外,这对于这种类型的环境会更好。我读过 kvm 是一种可行的方法,因为它更容易设置和管理,但如果我可以更好地利用 Xen 的硬件,我不介意更困难的设置。

linux kvm virtual-machine xen

8
推荐指数
2
解决办法
1014
查看次数

Linux 最快的虚拟化解决方案是什么?

还是XEN?或者是 VirtualBox、KVM、VmWare 还是其他?

最快的意思是来宾 VM 很快(由于虚拟化而造成的速度损失最小)

xen

8
推荐指数
2
解决办法
5970
查看次数

什么是 Dom0 以及如何使用它?

我听说 Xen 现在完全包含在 Linux 主线中,并且可以通过 Dom0 使用。

什么是Dom0,它的用途是什么?一个人怎么能用呢?

virtual-machine xen

8
推荐指数
1
解决办法
1万
查看次数

如何为我的 AMD Radeon GPU 配置 Xen GPU 直通?

我有一个安装了 Xen 4.2.0(从源代码编译)和一个 AMD Radeon 7750 GPU 的 Ubuntu Server 12.10 设置。我的 Xen 安装似乎可以正常工作,例如我可以创建虚拟机。

我已经设置了一个虚拟机,当使用 VNC 连接到它时它似乎工作正常。但是,在更改配置以启用 GPU 直通后,我的显示器上没有显示任何内容,VNC 只显示“serial0”并且不允许我做任何事情。

为了启用 GPU 直通,我将以下内容附加到我的配置文件中:

gfx_passthru=1
pci=['01:00.0']
Run Code Online (Sandbox Code Playgroud)

如何正确地将我的 GPU 传递给我的虚拟机?

graphics xen

7
推荐指数
1
解决办法
2787
查看次数

测量 VMware 和 Hyper-V 管理程序上的 CPU 窃取百分比

对于 Xen Linux 来宾,%steal可以通过 top 和其他实用程序轻松获得时间。

在运行非 Xen 虚拟机管理程序(例如 ESXi 或 Hyper-V)时,是否可以从 Linux 来宾中获取此指标和相关指标?

对于 Windows 来宾,VMware 和 Microsoft 都提供性能计数器。例子: vmware 性能

但是这些似乎并没有通过topCentos 6.4 中的vanilla 公开。

cpu virtual-machine xen virtualization

7
推荐指数
1
解决办法
8224
查看次数

为什么我无法使用桥接模式连接 ping 一个 xen domU?

我在 Debian 上从 7.11 升级到 8.5,所以 xen 包从 4.1 升级到 4.4。

我对网络不太了解,但是当我看到这样的图表(取自Xen Networking wiki 页面)时,我希望能够使用 ping 198.51.100.27 ping -I xenbr0 198.51.100.27,反之亦然ping 198.51.100.1

然而,这种情况并非如此。我设置了一个干净xenbr0

# brctl addbr xenbr0
# ifconfig xenbr0 192.168.12.1 netmask 255.255.255.0 up
Run Code Online (Sandbox Code Playgroud)

并在 HVM 配置文件中

vif=["mac=11:22:33:44:55:66, ip='192.168.12.2', bridge=xenbr0"]
Run Code Online (Sandbox Code Playgroud)

在我用 启动虚拟机后xl create,这是来自的输出brctl show

bridge name     bridge id               STP enabled     interfaces
xenbr0          8000.feffffffffff       no              vif3.0
                                                        vif3.0-emu
Run Code Online (Sandbox Code Playgroud)

我使用 SPICE 连接到 VM 并按如下所示进行配置:

在此处输入图片说明

由于我只是尝试 ping 默认网关,因此我假设不会进行名称解析。

使用此设置,ping 192.168.12.2 -I xenbr0在 …

networking bridge xen

7
推荐指数
1
解决办法
2513
查看次数