正是标题所说的。我没有太多运气找到合适的文档来查看 -xe 在以下用例中的作用:
#!/bin/bash -xe
这些参数有什么作用以及记录在哪里?
我经常登录生产 web/db/tools 框并看到典型消息:
可以更新30个包。16 个更新是安全更新。
我的问题是,你们所有人如何处理生产 Ubuntu 机器的更新?您是否自动执行这些更新?您是否为他们设置了停机时间?问题是,您永远不知道更新何时会破坏某些内容,例如现有的配置文件等。
这个问题的另一部分是,跟上补丁是“一件好事”,但补丁几乎每天都会发布。如果每天都有一个新的安全补丁可用,那么必须进行多少次计划中断?
我认为有关如何管理更新的答案的线程将非常有用。
我最近偶然发现了我的 EC2 实例的防火墙问题。TCP 端口通过 EC2 安全组提供给所有人,但是仍然使用 iptables 进行实例端过滤。我想如果有什么安全组只是 IPTables 的一个花哨的 API。事实证明,根据我的了解,它们完全是在运行。有什么理由同时使用两者吗?一个防火墙应该足够了,而添加另一层复杂性似乎只是等待发生而令人头疼。
与此同时,我正在考虑打开安全组中的所有端口,然后通过 iptables 进行所有过滤,或者相反,禁用 iptables 并使用安全组过滤。
关于我这里的逻辑是否有缺陷的任何反馈?我错过了一些关键的东西吗?
是否可以创建多个私钥以通过 SSH 连接到 EC2 实例?对此的一般最佳做法是什么?我们有多个用户需要通过 SSH 连接到服务器,而分发一个密钥是行不通的。除非我们更改密钥并重新分发,否则这不允许我们将用户从 SSH 连接到服务器的权限中删除。
我将 Amazon EC2 用于我的移动应用程序。根据给定时间应用程序的负载,我可能会产生新实例,然后在负载较低时将它们关闭以节省成本。
如何在这样一个动态环境中跟上 Nagios 的配置?当处理托管硬件时,配置文件是可预测的。在这种情况下,需要添加 Nagios、Capistrano 和一堆其他配置文件。Capistrano 需要知道将新构建部署到应用服务器的何处。Nagios 需要知道删除现有实例或添加新实例进行监控。Nagios 还需要知道节点是否被故意关闭,或者主机是否由于错误而关闭。
VPS/动态实例的美妙世界是如何做到的?
nagios configuration-management amazon-ec2 amazon-web-services capistrano
我目前正在使用 linux box 来使用 iptables 处理我的防火墙/NAT。它有两个 NIC,一个连接到 LAN 交换机,一个连接到我们的出口 Internet 提供商。我正在考虑将这个盒子升级到两个盒子以实现冗余,并向解决方案添加第二个 Internet 提供商。这意味着我需要四个我相信的端口(如果我错了,请纠正我)
我读过 carp+pfsync 是一个很好的解决方案。这是目前你们大多数人正在使用的吗?linux中是否有等效的解决方案?
对于与上述类似的设置,截至今天,对于易于配置的热故障转移有哪些建议?
你们如何管理您的 Amazon RDS 实例?在生产中,我显然希望使用 Amazon RDS 进行主从复制设置。不幸的是,将类似的东西引入开发/质量保证环境会产生大量成本,但我们努力使开发/质量保证尽可能接近生产环境。您在日常交易中如何处理这种情况?
我有一个 nagios 设置,可确保 SIP 在我的 Asterisk 服务器上响应,这很简单。
我的问题是,Asterisk 服务器实际上可以与终止提供程序正确终止的可能性是什么?就像在产生测试呼叫并确保另一端接听电话一样?
我意识到这是一个多部分且非常困难的问题。如果没有昂贵的设备,几乎不可能知道终端点的另一端是什么介质。
只是好奇你的 SIP/Asterisk 人正在做什么来监视这个以了解除了你的用户打电话给你告诉你是这种情况之外什么时候发生中断?
我有一个应用程序,其中客户端通过基于 TLS/SSL 的简单基于 TCP 的协议连接到服务器。在开发中,当我们构建应用程序时,这已经运行了好几个月。最近,当我们准备发布时,我继续将 HAProxy 添加到组合中,以促进负载分配的某些顺序。从技术上讲,一切正常,但问题是,客户端现在看到的是完全随机的超时。它们通常不一致,但发生在大约 60 秒时。有时它会在 25 秒后发生。haproxy 将 TCP 连接转发到通知并完全断开连接的服务器,问题是您不希望一堆同时发生的连接无故中断并一遍又一遍地重新连接。除了其他方面,这对我们的发布/订阅基础设施也有影响。客户端足够聪明,可以立即重新连接——但这不是我们想要的行为。负责通过 SSL 接受这些 TCP 连接的服务器不需要保持活动状态。我将继续假设有一些我在我的 HAProxy 配置中没有看到的隐式值导致这些随机超时,或者需要 TCP 保持活动的东西。然而,超时并不总是一致的事实让我怀疑。如果每次都是 60 秒,我就会确信这是一个配置问题。在这种特殊情况下,并不总是 60 秒。这是我的配置现在的样子:客户端足够聪明,可以立即重新连接——但这不是我们想要的行为。负责通过 SSL 接受这些 TCP 连接的服务器不需要保持活动状态。我将继续假设有一些我在我的 HAProxy 配置中没有看到的隐式值导致这些随机超时,或者需要 TCP 保持活动的东西。然而,超时并不总是一致的事实让我怀疑。如果每次都是 60 秒,我就会确信这是一个配置问题。在这种特殊情况下,并不总是 60 秒。这是我的配置现在的样子:客户端足够聪明,可以立即重新连接——但这不是我们想要的行为。负责通过 SSL 接受这些 TCP 连接的服务器不需要保持活动状态。我将继续假设有一些我在我的 HAProxy 配置中没有看到的隐式值导致这些随机超时,或者需要 TCP 保持活动的东西。然而,超时并不总是一致的事实让我怀疑。如果每次都是 60 秒,我就会确信这是一个配置问题。在这种特殊情况下,并不总是 60 秒。这是我的配置现在的样子:负责通过 SSL 接受这些 TCP 连接的 s 不需要保持活动状态。我将继续假设有一些我在我的 HAProxy 配置中没有看到的隐式值导致这些随机超时,或者需要 TCP 保持活动的东西。然而,超时并不总是一致的事实让我怀疑。如果每次都是 60 秒,我就会确信这是一个配置问题。在这种特殊情况下,并不总是 60 秒。这是我的配置现在的样子:负责通过 SSL 接受这些 TCP 连接的 s 不需要保持活动状态。我将继续假设有一些我在我的 HAProxy 配置中没有看到的隐式值导致这些随机超时,或者需要 TCP 保持活动的东西。然而,超时并不总是一致的事实让我怀疑。如果每次都是 60 秒,我就会确信这是一个配置问题。在这种特殊情况下,并不总是 60 秒。这是我的配置现在的样子:如果每次都是 60 秒,我就会确信这是一个配置问题。在这种特殊情况下,并不总是 …
我不知道为什么,但是在我重新启动 ec2 实例后,/dev/md0 没有像往常一样启动。在我看到 /dev/md* 中的可用内容后,而不是看到 /dev/md0,那里有一个名为 /dev/md127 的设备。我更新了 fstab 以反映新设备,并且能够成功安装它。查看 /proc/mdstat,它使用了最初创建 RAID 的正确基础临时卷:
[root@ip-10-0-1-21 ~]# cat /proc/mdstat
Personalities : [raid0]
md127 : active raid0 xvdc1[1] xvdb1[0]
870336512 blocks super 1.2 512k chunks
unused devices: <none>
Run Code Online (Sandbox Code Playgroud)
然而,当我运行一个mdadm --detail --scan
不同的设备名称时会出现:
[root@ip-10-0-1-21 ~]# mdadm --detail --scan
ARRAY /dev/md/ip-10-0-1-21:0 metadata=1.2 name=ip-10-0-1-21:0 UUID=543098de:1e9dc96e:4ce2444c:934bdfdf
Run Code Online (Sandbox Code Playgroud)
设备名称更改是否正常?我是否必须使用新设备名称更新 /etc/fstab?使用新信息重新运行 /etc/mdadm.conf 是否重要?这个设备名称是 /dev/md127 还是 dev/md/ip-10-0-1-21:0?我想我不确定这里发生了什么。一些见解会很棒。
amazon-ec2 ×4
linux ×2
nagios ×2
amazon-rds ×1
asterisk ×1
bash ×1
capistrano ×1
failover ×1
firewall ×1
haproxy ×1
iptables ×1
mdadm ×1
monitoring ×1
mysql ×1
networking ×1
openbsd ×1
raid ×1
scripting ×1
security ×1
sip ×1
tcp ×1
ubuntu ×1
update ×1
voip ×1