我有我的个人 VPN,连接多个设备,以便它们可以在始终可访问的网络上拥有固定的 IP 地址(只要它们连接到 Internet)。这对我来说是必要的,因为我的设备可能在移动中,在不同的和不可预测的网络上(4G 网络手机,大学里的笔记本电脑,家里的家庭服务器),而且我有一个需要连接到它们的备份服务器(有时,我也必须)。
我也在考虑安装类似 syncthing 的东西,这也可能受益于更低的延迟和更紧密的节点。
另外,我很懒,我喜欢从我的智能手机播放/暂停在我的家庭服务器上播放的音乐,这可能不在同一个网络上(应该,但并非总是如此)。
这意味着我有一个 OpenVPN 服务器,并且openvpn客户端在每台设备上运行。它们都连接到服务器,任何两个节点的任何流量都必须经过服务器,服务器相对较远,吞吐量非常有限。这意味着延迟和缓慢。当我按下“暂停”按钮时,实际暂停音乐最多可能需要 10 秒钟。即使两个节点实际上都在同一个 LAN 上(因为它们通过 VPN 进行通信)。嗯。
理想情况下,应该存在某种创建 VPN 的方法,能够找到节点之间的最短路径,并尝试直接连接它们。类似于 Skype 与超级节点合作的方式?
虽然服务器离这里很远,但其中一个节点有一个公共 IP 地址,其他节点可以访问。它可以充当它们的服务器——即使它不是服务器本身,尽管对于某些节点来说它是更好的选择。
我想我可以做一些类似于同时运行客户端和服务器的事情,并在该节点上桥接它们,但这看起来并不优雅。它是骇人听闻的,它使 PKI 复杂化,它拆分了 VPN。我不喜欢。
虽然我可以使用像 PPTP 这样的简单 VPN,它确实不能确保通信安全,但我决定不想费心配置 Bacula 来加密节点之间的连接,这意味着 VPN 内部的流量是简单的。VPN 封装是唯一的安全性,因此它应该不会很弱。但是,任何解决“网状”式 VPN 没有保密性的东西都已经是一个好的开始——我会确保流量开始通过 SSL/TLS。
这看起来像是其他人可能遇到的问题,并且现在已经解决了。有这样的吗?
我也有可能以错误的方式看待这个问题,但到目前为止,它看起来是确保我始终可以远程连接到我的任何设备的最佳方法,无论我在哪里,或者它们在哪里。
我正在研究设置由三个 CentOS 5.4 机器组成的负载平衡服务器解决方案。这些盒子中的两个将位于一个设施中,而第三个将位于不同的设施中。
我目前正在努力设置 heartbeat、ldirectord、ipvsadm 以对机器进行负载平衡,但我不确定它是否可以使用
我不太熟悉所有这些工作背后的细节,但是当这些服务器不在同一个 LAN 上时,负载平衡是否能正常工作?我不确定 heartbeat 是否使用 SNMP 发送信号,它只能在 LAN 上工作。有没有人尝试过这个或找到不同的解决方案?
linux centos load-balancing distributed-computing apache-2.2
假设有 100 台机器(每台机器有一个 2TB 硬盘),所有机器都连接在一个网络中。
有没有办法(在 Linux 中)将这 200TB 的磁盘空间合并到一个文件夹中,可以使用 NFS 在网络中的所有机器之间共享?
走这条路,所有机器都可以读/写同一个文件夹,这样,I/O 将在它们之间均匀分布。如果需要一个大型文件系统来存储 100 TB 的数据,这是一个好主意吗?(注意:数据将被拆分为许多较小的文件,每个文件的大小约为 500GB)。
是否有现成的解决方案(最好是开源的)可以实现这一目标?
在工作中,我们有一堆带有免费高清空间的盒子。我想在这些机器上运行类似 ZFS 的东西,让所有用户都可以使用大型虚拟文件系统。在我看来,它会映射为驱动器号 Z:,或者可能是 UNC \\zfs\,并且它会通过网络对数据块进行冗余备份,以便如果一台计算机出现故障,它可以最大限度地减少丢失的机会文件。
我看到了 CXFS、EMC Celera HighRoad、Melio FS、SAN-FS、StorNext 文件系统……
今天人们使用什么?特别是如果它是免费的!
编辑:一个想法是在 Sun VirtualBox 中运行 FreeNAS,并使用 ZFS - 但在我看来 ZFS 池不能跨计算机工作......?此外,运行虚拟盒子也不太理想。
背景:我们公司托管 SaaS DSS 应用程序,客户每天和/或每周向我们提供数据,我们对这些数据进行处理并合并到他们现有的数据库中。在工作时间内,服务器中的负载非常小,因为大多数用户通过网站运行简单的预定义查询,或者运行主要访问 SSAS OLAP 多维数据集的钻取报告。
我管理 IT 运营团队,到目前为止,这给我们带来了一个有趣的“扩展”问题。对于我们每日刷新的客户端来说,服务器仅在晚上“忙碌”约 4-6 小时。对于我们每周刷新的客户来说,服务器每周“繁忙”的时间可能只有 8-10 个小时!
我们已尽力使用一些简单的方法来分配负载,将日常客户端均匀分布在服务器之间,这样我们就不会尝试在夜间连续处理日常客户端。但从长远来看,这种扩展策略会带来两个值得注意的问题。首先,它将消耗大量长时间闲置的硬件。其次,需要大量的生产支持开销来基本上“调度”ETL,以便它们不会重叠,并且在客户端/调度超出特定服务器上的资源或分配的时隙时移动客户端/调度。
正如标题所暗示的,我们尝试过的一个选项是并行运行多个 SSIS 包,但在大多数情况下,这会产生非常不一致的结果。最常见的故障是 DTExec、SQL 和 SSAS 争夺物理内存并引发内存不足错误,以及 ETL 的运行时间比预期长 3、4、5 倍。因此,从我迄今为止的实践经验来看,在同一硬件上运行多个 ETL 包似乎不是一个好主意,但我不能成为第一个不想围绕手动调度和顺序扩展多个 ETL 的人加工。
我们考虑过的一种选择是虚拟化服务器,这显然不会为您提供任何额外的资源,而是将资源争用转移到虚拟机管理程序上,(根据我的经验)管理程序似乎可以同时管理 CPU/RAM/磁盘 I/O这比让 DTExec、SQL 和 SSAS 在 Windows 中展开竞争更加优雅。
向论坛提出的问题:所以我向论坛提出的问题是,我们是否在这里遗漏了一些明显的东西?是否有工具可以帮助管理在同一硬件上运行多个 SSIS 包?如果我们不是在同一台机器上运行 DTExec、SQL 和 SSAS(每台机器都运行该配置),而是在三台机器上运行,SSIS 在一台机器上运行,SQL 在另一台机器上运行,那么在并行执行方面会更“高效”吗? ,第三个是 SSAS?显然,只有当我们能够处理超过我们能够在机器上独立处理的三个 ETL 时,这才有意义。
我们考虑的另一种选择是完全重新构建我们的 SSIS 包,为所有客户端提供一个“主”包,尝试根据服务器在 CPU/内存/磁盘利用率方面的“繁忙”程度智能地选择服务器,但这将是一项艰巨的努力,而且我们似乎正在尝试重新发明一些你认为有人会出售的东西(尽管我没有运气找到它)。
总而言之,我们是否缺少一个明显的解决方案,是否有人知道是否有任何工具(免费或购买,无关紧要)可以促进在多个服务器上并行运行多个 SSIS ETL 包?(我称之为“基于队列和节点”的系统,但这不是官方术语)。最终,VMWare 的分布式资源调度程序解决了这个问题,因为您只需在每个虚拟机上运行一致数量的客户端,您知道这些客户端永远不会在调度方面发生冲突,然后由 VMWare 来移动虚拟机以平衡硬件使用。我绝对不反对使用 VMWare 来执行此操作,但由于我们是 100% Microsoft 应用程序堆栈,似乎有人会通过检查资源在应用程序层而不是虚拟机管理程序层解决此问题操作系统、SQL、SSAS 级别的利用率。
我愿意接受任何有关此问题的讨论,并记住没有任何建议是太疯狂或激进的!:-) 目前,VMWare 是我们发现的摆脱“手动”平衡资源的唯一选择,因此任何能让我们继续使用纯 Microsoft 堆栈的建议都很棒。
多谢你们,
Docker、Mesos、Kubernetes 等新技术可以在组织中更好地利用服务器。但是,考虑到整个数据中心的故障,我想知道如何最大限度地提高两个数据中心的利用率。
鉴于这种情况:
两个数据中心(DC-A 和 DC-B)具有等量的计算资源。两个数据中心都以负载平衡/循环方式运行和处理请求。两个数据中心的服务器利用率均为 80%。
假设 DC-B 出现故障(物理或网络)并且无法访问。DC-A 将无法再增加 80% 的利用率,因为它本身已经达到了 80%。使组织处于 DC-A 可能无法处理额外需求并导致中断的状态……
这是否意味着两个数据中心(DC-A 和 DC-B)的组织每个数据中心的最大利用率只能达到 50%?即任何一个 DC 失败,另一个 DC 将能够弥补另一个 DC 的松弛(50% + 50%)。
这种想法正确吗?其他人如何处理这个问题或者我错过了什么?
datacenter utilization distributed-computing kubernetes apache-mesos
我希望实现一种身份验证机制,该机制允许根据客户端的域名强制执行访问策略。身份验证服务器使用 DNS 中可用的信息来验证客户端授权。
更多细节:
访问策略 资源所有者将资源访问权限限制在特定的子域(例如 my-x-service.clientexample.com)。要访问资源,客户端必须证明它拥有子域或者它是授权代表域所有者访问该资源的第 3 方。
身份验证 为了证明它代表域所有者行事,客户端必须将其 IP 地址列入域名的 TXT 记录的白名单。身份验证服务器将客户端请求的 IP 地址与提供的声明域的 TXT 记录上发布的列表进行匹配。如果两者匹配,则授予对资源的访问权限。
http://maps.serverexample.com/getLocationByname?params
Content-Type: application/JSON
Claim-Domain: my-x-service.clientexample.com
Run Code Online (Sandbox Code Playgroud)
是否已经有这样的标准?我只知道 SPF,但由于它用于电子邮件,我认为规范需要一些调整。
编辑 -

filesystems ×2
linux ×2
apache-2.2 ×1
apache-mesos ×1
centos ×1
datacenter ×1
kubernetes ×1
openvpn ×1
p2p ×1
spf ×1
sql ×1
sql-server ×1
ssis ×1
utilization ×1
vpn ×1
windows ×1