是否有任何文档或资源描述如何生成和托管 OpenVPN 客户端导入的配置文件?理想情况下,我的用户不必单独获取 .ovpn + 证书的 .zip 文件,将其解压缩到正确的目录,调整他们的 .ovpn 等。
在管理自己集群的人中(即不使用/支付 Amazon Autoscale、Rightscale、Scalr 等),您如何管理 EC2 上的实例并处理(例如)故障转移?我想知道是否大多数人最终会像我怀疑的那样针对 EC2 API 编写自己的大量脚本。
这当然是我们的方法:启动我们自己的基于 Python Boto 的监控/重启守护进程,该守护进程在异地运行,从我们的实例中监听 UDP 保持活动。失败时,我们对卷进行快照、注册映像、启动新实例、删除旧卷等。
每隔一段时间,当对我们的脚本进行黑客攻击时,我认为必须有一些开源工具已经可以处理这些问题,并且没有(比如)Scalr 的限制,但我总是从谷歌回来空手而归。(像 Scalr 这样的东西在支持的软件集/版本/配置方面非常有限,并且有专门的和 IMO 繁琐的方法来操纵这些设置。)
此外,Linux-HA/Pacemaker 生态系统(Heartbeat、ldirectord 等)听起来并不适合 EC2。(但后来我发现了这一点——尽管我不确定这是否真的是一个高质量的解决方案)。
尽管我们将近一半的内存用于 FS 缓存,但我们还是遇到了 OOM 杀手。我们每分钟记录一次内存统计信息(如 top 所报告的),但似乎有很多可用性。
...
Mem: 15339640k total, 15268304k used, 71336k free, 3152k buffers
Swap: 0k total, 0k used, 0k free, 6608384k cached
Mem: 15339640k total, 14855280k used, 484360k free, 13748k buffers
Swap: 0k total, 0k used, 0k free, 6481852k cached
[OOM killer: postgres killed]
Mem: 15339640k total, 8212200k used, 7127440k free, 32776k buffers
Swap: 0k total, 0k used, 0k free, 2394444k cached
...
Run Code Online (Sandbox Code Playgroud)
来自系统日志的 OOM 详细信息:
...
Jun 10 05:45:25 db kernel: [11209156.840462] wal-e invoked oom-killer: …
Run Code Online (Sandbox Code Playgroud) 我在 Ubuntu 10.04 上的 Apache/2.2.14 上运行(自签名)SSL 证书站点,但是各种浏览器在一半的连接尝试中都出现错误。刚刚从 Chrome 中看到这个暂时性错误:
"Error 126 (net::ERR_SSL_BAD_RECORD_MAC_ALERT): Unknown error."
Run Code Online (Sandbox Code Playgroud)
点击刷新,问题会消失一段时间。
wget也是:
$ wget --no-check-certificate https://dev.foo.com/deps/
--2010-09-08 19:30:26-- https://dev.foo.com/deps/
Resolving dev.foo.com... 184.72.53.220
Connecting to dev.foo.com|184.72.53.220|:443... connected.
OpenSSL: error:0407006A:rsa
routines:RSA_padding_check_PKCS1_type_1:block type is not 01
OpenSSL: error:04067072:rsa routines:RSA_EAY_PUBLIC_DECRYPT:padding check failed
OpenSSL: error:1408D07B:SSL routines:SSL3_GET_KEY_EXCHANGE:bad signature
Unable to establish SSL connection.
Run Code Online (Sandbox Code Playgroud)
立即再次运行它,它可以工作:
$ wget --no-check-certificate https://dev.foo.com/deps/
--2010-09-08 19:30:29-- https://dev.foo.com/deps/
Resolving dev.foo.com... 184.72.53.220
Connecting to dev.foo.com|184.72.53.220|:443... connected.
WARNING: cannot verify dev.foo.com's certificate, issued by
`/CN=dev.foo.com':
Self-signed certificate encountered.
HTTP request sent, …
Run Code Online (Sandbox Code Playgroud) 我按照各种 教程/文档在 Ubuntu 12.04 服务器(在 EC2 上)上配置了 openswan 和 xl2tpd,这些教程/文档似乎在很大程度上说的是相同的事情,但最近这个.
但是,我尝试从 Windows(我使用共享机密和用户名/密码配置)连接失败。日志表明已建立 IPsec 隧道,但没有任何反应。
以下是数据包转储和日志活动(系统日志中没有发生任何事情,因此没有 iptables 日志消息):
$ sudo tcpdump -n host 64.236.139.254 and not port 22
21:00:49.843198 IP 64.236.139.254.26712 > 10.252.60.213.500: isakmp: phase 1 I ident
21:00:49.844815 IP 10.252.60.213.500 > 64.236.139.254.26712: isakmp: phase 1 R ident
21:00:49.928882 IP 64.236.139.254.26712 > 10.252.60.213.500: isakmp: phase 1 I ident
21:00:49.930819 IP 10.252.60.213.500 > 64.236.139.254.26712: isakmp: phase 1 R ident
21:00:49.972728 IP …
Run Code Online (Sandbox Code Playgroud) 我在 /etc/postfix/main.cf 中有:
smtpd_sasl_auth_enable = yes
smtpd_recipient_restrictions = permit_sasl_authenticated, permit_mynetworks, reject_unauth_destination
Run Code Online (Sandbox Code Playgroud)
并且 SASL 似乎正在工作:
$ testsaslauthd -u yang -p ... -f /var/spool/postfix/var/run/saslauthd/mux -s smtpd
0: OK "Success."
Run Code Online (Sandbox Code Playgroud)
但是从网络外部连接时,我收到“中继访问被拒绝”(例如 localhost 仍然可以正常工作):
$ telnet blah.com 25
auth plain ...
235 2.7.0 Authentication successful
mail from:<yang@blah.com>
250 2.1.0 Ok
rcpt to:<yang@dest.com>
554 5.7.1 <yang@dest.com>: Relay access denied
Run Code Online (Sandbox Code Playgroud)
日志:
Oct 18 21:10:19 blah postfix/smtpd[13882]: connect from unknown[x.x.x.x]
Oct 18 21:10:19 blah postfix/smtpd[13882]: setting up TLS connection from unknown[x.x.x.x]
Oct 18 21:10:19 blah postfix/smtpd[13882]: Anonymous …
Run Code Online (Sandbox Code Playgroud) Pacemaker 生态系统(Corosync 等)在 EC2 环境中有意义吗?直到某个时候,Corosync 需要 IP 多播(在 EC2 上不可用),但我认为它现在已经广播了。仍然,是起搏器等。阿尔。集群在 EC2 上管理自身的正确工具,例如相互监控故障,从而触发创建新实例以替换故障实例?
我想这个问题的一部分是,我已经花了相当多的时间只是理顺所有的球员在这里(心跳,Corosync,OpenAIS的,等等),而且我仍然试图找出这些东西其实都是(超越模糊的术语,例如 Pacemaker 是一个“集群资源管理器”,而 Corosync 提供“可靠的消息传递和成员资格基础设施”)。
因此,如果我的问题本身有点笨拙或不完全合理,我深表歉意。任何见解将不胜感激。谢谢。
当我使用 apt 更新我的系统(例如 run sudo aptitude full-upgrade
)时,它有时会安装需要重新启动的更新。这尤其适用。用于内核(安全)更新。
我有时可以在 ssh 登录消息中看到这一点。我想知道如何(否则)我可以确定系统是否由于这些更新而需要重新启动。
您如何让 Postfix 以从客户端收到的完整形式(所有标头 + 有效负载)记录所有外发邮件的日志?到目前为止always_bcc
,我找到的最接近的参数是,但这会丢失一些信息(至少是 RCPT-TO 信息)。提前感谢您的任何提示。
我没有从文档中找到有关修复工作原理以及要求的详细信息。
对于磨砂膏的自动修复,我需要镜像吗?RAIDZ?任何一个?两者都不是(校验和本身是否包含奇偶校验)?
我无法重新启动我的 Ubuntu 9.04 x86_64 机器。我只看到以下内容,然后什么也没有发生。我已经输入过好几次了。
$ sudo reboot
[sudo] password for yang:
$
Broadcast message from yang@harvard.csail.mit.edu
(/dev/pts/7) at 4:31 ...
The system is going down for reboot NOW!
Run Code Online (Sandbox Code Playgroud)
可能相关的信息:在 NFS/NIS 服务器(同一主机)几个小时无法访问后,我的 amd 管理的 NFS 挂载已经失控。我可以很好地创建新的 NFS 挂载,但现有的 NFS 挂载没有响应(或更准确地说,几乎没有响应)。例如,目录上的 ls 挂起几分钟,然后失败,只有一些子目录实际列出(尽管为红色),而其他子目录则导致“没有这样的文件或目录”错误消息。
这是因为我的 NFS 安装已经失控,所以我尝试重新启动(我尝试卸载这些安装但无济于事)。我已经等了三天了。
我运行的是定期更新的 Ubuntu 9.04。我无法物理访问计算机,因此能够重新启动计算机而不是简单地关闭计算机非常重要。顺便说一句,如果有人知道如何在不重新启动的情况下处理挂起的 NFS 挂载,那么知道这一点也很好。
预先感谢您的任何帮助。
我使用的是非常普通的 Ubuntu Server 9.04,并且 cron 没有向我的 /var/mail/USER 发送任何邮件(该文件甚至还没有创建)。这是我的完整 crontab:
# m h dom mon dow command
15 * * * * $HOME/.cron/sync-bookmarks.bash
Run Code Online (Sandbox Code Playgroud)
如果我添加
# m h dom mon dow command
15 * * * * $HOME/.cron/sync-bookmarks.bash >& /tmp/log
Run Code Online (Sandbox Code Playgroud)
然后我在 /tmp/log 中看到 stdout 和 stderr。我(还)对实际的远程电子邮件传递不感兴趣,只是对邮件假脱机文件的本地传递感兴趣。为什么邮件不起作用?提前感谢您的任何提示。