linux下如何允许用户向其他用户传输文件

我们有一个数千名用户在大约 40 个集群上运行应用程序的环境，集群的大小从 20 个计算节点到 98,000 个计算节点不等。这些系统上的用户生成由传统 unix 权限控制的大量文件（有时> 1PB）（由于文件系统的特殊性质，ACL 通常不可用或不实用）。

我们目前有一个名为“give”的程序，它是一个 suid-root 程序，允许用户在组权限不足时将文件“给”给另一个用户。因此，用户会键入以下内容以将文件提供给另一个用户：

> give username-to-give-to filename-to-give ...

Run Code Online (Sandbox Code Playgroud)

然后，接收用户可以使用名为“take”的命令（give 程序的一部分）来接收文件：

> take filename-to-receive

Run Code Online (Sandbox Code Playgroud)

然后文件的权限被有效地转移到接收用户。

这个程序已经存在多年了，我们想从安全和功能的角度重新审视这些事情。

我们当前的行动计划是在我们将其重新部署到生产中之前，消除我们当前“give”实现中的位腐烂并将其打包为开源应用程序。

当只有传统的 unix 权限可用时，有没有人使用另一种方法在用户之间传输超大文件？

linux filesystems hpc

Jon*_*rst

lucky-day

11
推荐指数

1
解决办法

7372
查看次数

为什么在运行带有内置插件的 SLURM 的集群上请求 GPU 作为通用资源会失败？

免责声明：这篇文章很长，因为我试图提供所有相关的配置信息。

状态和问题：

我管理一个 gpu 集群，我想使用 slurm 进行作业管理。不幸的是，我无法使用 slurm 的相应通用资源插件来请求 GPU。

注意：test.sh 是一个打印环境变量 CUDA_VISIBLE_DEVICES 的小脚本。

正在运行的作业`--gres=gpu:1`未完成

运行srun -n1 --gres=gpu:1 test.sh结果如下错误：

srun: error: Unable to allocate resources: Requested node configuration is not available

Run Code Online (Sandbox Code Playgroud)

日志：

gres: gpu state for job 83
    gres_cnt:4 node_cnt:0 type:(null)
    _pick_best_nodes: job 83 never runnable
    _slurm_rpc_allocate_resources: Requested node configuration is not available

Run Code Online (Sandbox Code Playgroud)

运行作业`--gres=gram:500`确实完成

srun -n1 --gres=gram:500 test.sh但是，如果我打电话，作业会运行并打印

CUDA_VISIBLE_DEVICES=NoDevFiles

Run Code Online (Sandbox Code Playgroud)

日志：

sched: _slurm_rpc_allocate_resources JobId=76 NodeList=smurf01 usec=193
debug:  Configuration for job 76 complete
debug:  laying …

Run Code Online (Sandbox Code Playgroud)

cluster job-scheduler hpc

Pix*_*hem

2015 04-27

10
推荐指数

1
解决办法

5407
查看次数

XFS 添加配额 - 在第一次挂载/启动时跳过配额检查

我们在集群上运行了一个 14TB XFS 文件服务器，并希望添加配额支持。这是在 CentOS 6.3 (Final) 下运行 3.9.2-1.el6.elrepo.x86_64 内核。

问题是当我们卸载 XFS RAID 并重新挂载它以添加配额支持时，挂载命令挂起。服务器响应并且无法访问XFS 挂载点。恢复我们在 /etc/fstab 中的更改以删除配额选项不会挂载挂载。

我怀疑在重新安装时，XFS 会在 14TB RAID 上运行配额检查。我的问题是：如何禁用初始配额检查，以便它可以正确安装并在后台运行配额检查？

/etc/fstab 入口：

/dev/sdb      /w1      xfs     defaults,noatime,usrquota,grpquota 1 2

Run Code Online (Sandbox Code Playgroud)

/var/log/messages 输出：

Jun  6 11:37:43 nas-2-1 kernel: XFS (sdb): Mounting Filesystem
Jun  6 11:37:43 nas-2-1 kernel: XFS (sdb): Ending clean mount
Jun  6 11:37:43 nas-2-1 kernel: XFS (sdb): Quotacheck needed: Please wait.

Run Code Online (Sandbox Code Playgroud)

我不介意挂载点处于活动状态时 CPU 使用率高或性能低，但让它不可用不是我们想要坚持的选项。我怀疑对 14TB 运行配额检查大约需要一个完整的工作日。

linux xfs centos disk-space-utilization hpc

Ada*_*dam

lucky-day

7
推荐指数

1
解决办法

4453
查看次数