相关疑难解决方法(0)

查找重复文件

是否可以在我的磁盘上找到重复文件,这些文件有点相同但具有不同的文件名?

files duplicate-files

103
推荐指数
5
解决办法
7万
查看次数

ls -i 中的 inode 编号与磁盘上的 inode 有何关系

我正在尝试了解 inode 编号(如 所示ls -i)如何与 ext4 分区配合使用。

我试图了解它们是否是 linux 内核的构造并映射到磁盘上的 inode,或者它们是否实际上存储在磁盘上的相同数字。

问题:

  1. 重新启动计算机时,inode 编号会更改吗?
  2. 当挂载两个分区时,可以ls -i为两个不同的文件生成相同的 inode 编号,只要它们在不同的分区上即可。
  3. 可以在不重新启动或重新安装分区的情况下回收 inode 编号吗?

我为什么要问...

我想在具有 1.5TB 数据和大约 2000 万个文件(文件名)的 USB 硬盘驱动器上创建二级索引。文件范围从 10 字节到 100 GB。其中许多是多次硬链接,因此单个文件(磁盘上的 blob)可能有多达 200 个文件名。

我的任务是通过检测重复项并用更多硬链接替换重复项来节省磁盘空间。

现在作为一个单独的练习,我想我可以为磁盘上的每个文件创建一个数据库,它是 shasum、权限等......一旦构建,检测重复应该是微不足道的。我需要确定我使用的是正确的唯一键。由于存在大量硬链接,文件名不合适。我希望我可以使用 inode 编号。

我想了解的是,当我下次重新启动机器时,我们是否会更改 inode 编号。或者,如果它们更加不稳定(在我构建数据库时它们会改变吗?)

我阅读的所有文档都捏造了内核提供的 inode 编号与磁盘上的 inode 之间的区别。根据我已经阅读的文章,这些是否相同尚不清楚。

linux filesystems ext4 inode

2
推荐指数
1
解决办法
1345
查看次数

`-dD` 对 `uniq` 意味着什么?

来自https://unix.stackexchange.com/a/277707/674

find . ! -empty -type f -exec md5sum {} + | sort | uniq -w32 -dD
Run Code Online (Sandbox Code Playgroud)

可以找到当前目录下的重复文件。

是什么-dD意思uniq?我在联机帮助页中看到了-d和的含义-D,但不确定它们一起使用时的含义。谢谢。

coreutils uniq

1
推荐指数
1
解决办法
469
查看次数

标签 统计

coreutils ×1

duplicate-files ×1

ext4 ×1

files ×1

filesystems ×1

inode ×1

linux ×1

uniq ×1