我写了一个 nagios 脚本的一半,我对 SSH 感到烦恼。
根据手册页:
-q Quiet mode. Causes all warning and diagnostic messages to be
suppressed.
Run Code Online (Sandbox Code Playgroud)
然而,如果我启用了 quiet 标志然后传递了一个无效的端口,我仍然会收到一个错误:
$ ssh user@localhost -q -p test
Bad port 'test'
Run Code Online (Sandbox Code Playgroud)
这是一个问题,因为这将使该消息成为第一行,而这正是 Nagios 抓取的内容。!= 0从 ssh 获取退出代码后,我需要输出类似“警告|SSH 错误”的内容,但我可以输出的第一行将是第 2 行。
我怎样才能让 SSH 真正安静下来?
注意:我不确定是在 serverfault、超级用户还是 stackoverflow 上发布这个问题。我选择了 serverfault,因为用户群可能对 cli SSH 和 cli 脚本解决方法最有经验。
在这个问题上切入正题,因为我正在寻求尽可能多样化的解决方案,所以不想过多地影响任何意见。
我们已经有了很多想法,但我想知道 ServerFault 的用户将如何解决这个问题。随意问的问题 :)
windows replication wide-area-network network-share infrastructure
我想要一个 UNIX 域套接字,例如 /var/program/program.cmd,通过 TCP 公开,比如说在端口 12345 上。我也希望它在后台全时运行。
做到这一点的最佳方法是什么?如果相关,则系统正在运行 Ubuntu 12.04.2。
同样使用建议的解决方案,它是否会在删除和重新创建域套接字后继续存在?
编辑
以下是 init 脚本形式的已接受答案的结果:https : //github.com/Wirehive/haproxy-remote
问题
我们在现有平台上的性能存在问题,所以我正在转向蜂巢思维,以寻求对此的第二意见。到目前为止,性能问题与 IOPS 而不是吞吐量有关。
情景
由 16 台主机组成的刀片中心,每台主机具有 64GB 的 RAM。(它是带有 M610 的 Dell M1000e,但这可能无关紧要)500 台虚拟机、所有 Web 服务器(或相关的 Web 技术,例如 MySQL、负载平衡器等),大约 90% 是 Linux,其余为 Windows。管理程序是 VMWare vSphere。我们需要提供主机HA,所以本地存储用完了。因此,主机只需一张 SD 卡即可启动。
一点背景思考
目前,我们有多达 6 台主机(刀片中心将在一年内以目前的增长达到满负荷),并且我们正在将 iSCSI 运行到带有 MD1220 的 Dell MD3220i 以进行扩展。
我们考虑过的可能选项,以及随之而来的即时想法:
问题
你会在所有这些之下运行什么样的存储?它不需要扩展到另一个刀片中心,它只需要为所有这些 VM 提供相对良好的性能。
我不是在寻找“购买 SAN x 因为它是最好的”的答案。我正在寻找关于各种 SAN 技术(iSCSI、FC、FCoE、InfiniBand、NFS 等)、不同类型的存储(SATA、SAS、SSD)以及处理 100 多个 VM …
virtualization storage storage-area-network nfs vmware-vsphere
这与多租户环境有关,例如小型托管公司。
Puppet(或类似)是否适合处理基本但关键的质量变化?例如:
我担心的是安全性和侵入性:
我应该说明一下,我从未在生产中使用过 Puppet,只是在测试实验室中快速玩过,所以我可能会以错误的方式思考这个问题!
我的组织处于这样一个位置,我们为我们的主要数据中心提供商的单宿主 IP 传输支付了相当高的费用。我们现在处于准备开始考虑与公交提供商建立直接关系的位置。
这个问题在这里关于这个问题去触摸略有下降,但它不是很全面。例如,公认的答案指出 Cogent 和 Hurricane Electric 被认为是廉价供应商,而 Level(3)、AT&T、Telia 被认为更好。它没有做的是准确解释为什么一个提供商可能比另一个更好。
我非常熟悉 BGP、多宿主以及对等互连和传输的概念,但是我不了解为什么其中一些提供商会比其他提供商更好。
需要明确的是,我不是要求提供者的建议,也不是为此提及的任何名称。我非常乐意去做我自己的“购物”研究。我只是有一个问题,我需要将苹果与苹果进行比较,我不知道要寻找什么!
如果它有所作为,我们的组织就在英国。
这是一个完全假设的问题,我现在不在这种情况下。
如果您运行多租户网络并且拥有超过 4096 个客户,您的 VLAN 拓扑和路由会发生什么变化?
您是否必须在最高级别开始将您的网络“分区”到新的路由器/交换机树中,然后重新开始使用 VLAN 编号?
我需要定期远程检查 Linux 文件系统是否安装在许多服务器上只读。在这种情况下,我可以使用的唯一工具是常用的 CLI 脚本语言(BASH/Perl/Python)、SSH 和 SNMP。
到目前为止,我的想法是:
SNMP 方法是我能想到的最好/最干净的方法,但是我不知道如何执行此操作,因为 CLI SNMP 似乎是一场噩梦,特别是如果我需要通过决策过程来查找基于给定的挂载点。
理想情况下,我想仅使用 BASH(包括 sed/awk/grep 等)和 SNMP 来解决这个问题,但需要一些关于从哪里开始的指导!已经在所有相关服务器上为 v2 安装和配置了 snmpd。
此脚本的最终用途将作为 Nagios 命令。
非常感谢您的帮助!
注意 我们已经有 cacti/nagios 设置监控 100 台服务器,我在最初发布时忘记提及这一点!
我有一个多线程软件,它在最新的 ubuntu 服务器、redhat Enterprise 和 CentOS 下以不同的速度运行——它们都安装在完全相同的服务器上以进行比较。
Ubuntu 服务器最慢,其次是 CentOS,然后是 Redhat Enterprise。差异为10-20%。
centOS 和 redhat 之间的区别可以通过更新的 gcc 版本来解释,但至少在最后两个操作系统中使用了相同版本的 gcc。
我在 ubuntu 运行中看到的是,尽管该程序使用了 13 个内核,但“top”报告的 CPU 总数约为 1220%,而在 redhat(和 centOS)上为 1300%
有人有解释吗?我更喜欢使用 Ubuntu(它是免费的),但我无法承受减速。我尝试了其他多线程基准测试,这似乎也表明 ubuntu 有点慢——在同一个下载的可执行文件上,而不是在本地编译。
我们经常在备份作业中看到这样的错误:
10/05/2013 12:21:18 :: Cannot use CBT: Soap fault. Error caused by file /vmfs/volumes/781f6afc-ea228458/VDED-CIT-010(Exchange EX01)/VDED-CIT-010(Exchange EX01).vmdkDetail: '', endpoint: ''
Run Code Online (Sandbox Code Playgroud)
在备份的 235 个虚拟机中运行了 11 个的上一个作业中将此作为警告。
作为一个完整的例子,这里是一个 VM 的统计输出:
09/05/2013 22:02:14 :: Queued for processing at 09/05/2013 22:02:14
12/05/2013 02:30:00 :: Required backup infrastructure resources have been assigned
12/05/2013 02:30:02 :: VM processing started at 12/05/2013 02:30:02
12/05/2013 02:30:02 :: VM size: 20.0 GB (3.9 GB used)
12/05/2013 02:30:02 :: Using source proxy 10.24.0.11 [nbd]
12/05/2013 02:30:36 :: Creating VM snapshot
12/05/2013 …Run Code Online (Sandbox Code Playgroud)