php glob - 在子文件夹中扫描文件

Win*_*ith 30 php search glob file

我有一个服务器,在各种文件夹,子文件夹和子子文件夹中有很多文件.

我正在尝试创建一个search.php页面,用于在整个服务器中搜索特定文件.如果找到该文件,则返回位置路径以显示下载链接.

这是我到目前为止所拥有的:

$root = $_SERVER['DOCUMENT_ROOT'];
$search = "test.zip";
$found_files = glob("$root/*/test.zip");
$downloadlink = str_replace("$root/", "", $found_files[0]);
if (!empty($downloadlink)) {
    echo "<a href=\"http://www.example.com/$downloadlink\">$search</a>";
} 
Run Code Online (Sandbox Code Playgroud)

如果文件在我的域名的根目录内,脚本工作正常...现在我正在尝试找到一种方法使它也扫描子文件夹和子子文件夹,但我被困在这里.

Ton*_*hen 59

有两种方法.

用于glob进行递归搜索:

<?php

// Does not support flag GLOB_BRACE
function rglob($pattern, $flags = 0) {
    $files = glob($pattern, $flags); 
    foreach (glob(dirname($pattern).'/*', GLOB_ONLYDIR|GLOB_NOSORT) as $dir) {
        $files = array_merge($files, rglob($dir.'/'.basename($pattern), $flags));
    }
    return $files;
}

?>
Run Code Online (Sandbox Code Playgroud)

使用 RecursiveDirectoryIterator

<?php
function rsearch($folder, $pattern) {
    $dir = new RecursiveDirectoryIterator($folder);
    $ite = new RecursiveIteratorIterator($dir);
    $files = new RegexIterator($ite, $pattern, RegexIterator::GET_MATCH);
    $fileList = array();
    foreach($files as $file) {
        $fileList = array_merge($fileList, $file);
    }
    return $fileList;
}
?>
Run Code Online (Sandbox Code Playgroud)

RecursiveDirectoryIterator来自globPHP4,附带PHP5 .两者都能胜任,这取决于你.

  • rsearch:`var_dump(rsearch('/ folder /.../','/.*zip /'));`rglob:`var_dump(rglob('/ folder/*/test.zip'));`it返回匹配文件的数组. (7认同)
  • 好的,但我如何使用它来搜索文件夹/子文件夹/子文件夹中的特定文件并返回文件的路径? (2认同)
  • @JasonRDalton,在一个 60MB 的项目树(有两个中等大小的 git 工作树和许多其他小文件等)上使用 PHP 7.1(“轶事”,也是 :) 重新测试,结果正好相反。在测量之前对两者进行了启动运行,我一直得到类似的数字:`rglob`:0.02864,`rsearch`:0.12413。我会说,实际上,这比其他方式更合理。 (2认同)

met*_*der 9

作为您问题的完整解决方案(这也是我的问题):

<?php
function rsearch($folder, $pattern) {
    $dir = new RecursiveDirectoryIterator($folder);
    $ite = new RecursiveIteratorIterator($dir);
    $files = new RegexIterator($ite, $pattern, RegexIterator::MATCH);


    foreach($files as $file) {
         yield $file->getPathName();
    }
}
Run Code Online (Sandbox Code Playgroud)

将为您提供您想要查找的项目的完整路径。

编辑:感谢Rousseau Alexandre指出, $pattern 必须是正则表达式。


Qua*_*one 6

我想为可以预测最大深度的情况提供另一种简单的选择。您可以使用带有大括号的模式,列出所有可能的子文件夹深度。

本示例允许使用0-3个任意子文件夹:

glob("$root/{,*/,*/*/,*/*/*/}test_*.zip", GLOB_BRACE);
Run Code Online (Sandbox Code Playgroud)

当然,可以在程序上生成支撑模式。


Sad*_*dee 5

这将全路径返回到文件

function rsearch($folder, $pattern) {
    $iti = new RecursiveDirectoryIterator($folder);
    foreach(new RecursiveIteratorIterator($iti) as $file){
         if(strpos($file , $pattern) !== false){
            return $file;
         }
    }
    return false;
}
Run Code Online (Sandbox Code Playgroud)

调用函数:

$filepath = rsearch('/home/directory/thisdir/', "/findthisfile.jpg");
Run Code Online (Sandbox Code Playgroud)

这是像这样的回报:

/home/directory/thisdir/subdir/findthisfile.jpg

您可以改进此功能以查找多个文件,例如所有jpeg文件:

function rsearch($folder, $pattern_array) {
    $return = array();
    $iti = new RecursiveDirectoryIterator($folder);
    foreach(new RecursiveIteratorIterator($iti) as $file){
        if (in_array(strtolower(array_pop(explode('.', $file))), $pattern_array)){
            $return[] = $file;
        }
    }
    return $return;
}
Run Code Online (Sandbox Code Playgroud)

这可以称为:

$filepaths = rsearch('/home/directory/thisdir/', array('jpeg', 'jpg') );
Run Code Online (Sandbox Code Playgroud)

参考:https : //stackoverflow.com/a/1860417/219112

  • 可能应该使用 `$file-&gt;getExtension ()` 而不是 `array_pop(explode('.', $file))` 来避免“PHP 注意:只有变量应该在...中通过引用传递”。 (4认同)
  • 您可能需要使用“yield”而不是构建完整的“$return”数组。这将生成一个生成器并大大提高性能。 (2认同)