有效地列出具有大量条目的目录中的文件

Dus*_*rea 4 go

我需要递归地读取目录结构,但在读完每个目录的所有条目后,我还需要执行额外的步骤。因此,我需要编写自己的递归逻辑(并且不能使用简单的filepath.Walk例程)。但是,ioutil.ReadDirfilepath.Glob例程仅返回切片。如果我突破了ext4xfs的限制并且目录中的文件数量达到数十亿,该怎么办?我希望golangos.FileInfo有一个函数,可以通过通道返回一系列未排序的(或者更好的是原始字符串)而不是排序的切片。在这种情况下我们如何有效地读取文件条目呢?

上面引用的所有函数似乎都依赖于readdirnamesos /dir_unix.go,并且出于某种原因,它只是在看起来很容易生成 gothread并将值推入通道时创建一个数组。这样做可能有合理的逻辑,但尚不清楚它是什么。我是 Go 新手,所以我也可能很容易错过一些对其他人来说都很明显的原则。

为了方便起见,这是源代码:

func (f *File) readdirnames(n int) (names []string, err error) {
    // If this file has no dirinfo, create one.
    if f.dirinfo == nil {
        f.dirinfo = new(dirInfo)
        // The buffer must be at least a block long.
        f.dirinfo.buf = make([]byte, blockSize)
    }
    d := f.dirinfo

    size := n
    if size <= 0 {
        size = 100
        n = -1
    }

    names = make([]string, 0, size) // Empty with room to grow.
    for n != 0 {
        // Refill the buffer if necessary
        if d.bufp >= d.nbuf {
            d.bufp = 0
            var errno error
            d.nbuf, errno = fixCount(syscall.ReadDirent(f.fd, d.buf))
            if errno != nil {
                return names, NewSyscallError("readdirent", errno)
            }
            if d.nbuf <= 0 {
                break // EOF
            }
        }

        // Drain the buffer
        var nb, nc int
        nb, nc, names = syscall.ParseDirent(d.buf[d.bufp:d.nbuf], n, names)
        d.bufp += nb
        n -= nc
    }
    if n >= 0 && len(names) == 0 {
        return names, io.EOF
    }
    return names, nil
}
Run Code Online (Sandbox Code Playgroud)

Jim*_*imB 6

ioutil.ReadDirfilepath.Glob只是读取目录条目的便利功能。

如果您提供的参数 > 0,则可以直接使用Readdir或方法批量读取目录条目。Readdirnamesn

对于像读取目录条目这样基本的事情,不需要添加 goroutine 和通道的开销,并且还提供了返回错误的替代方法。如果您愿意,您始终可以使用自己的 goroutine 和通道模式包装批量调用。