递归查找具有特定扩展名的文件

fli*_*lip 402 linux bash recursion

我正在尝试使用我的bash(最新的Ubuntu LTS版本)在目录及其子目录中查找具有特定扩展名的所有文件.

这是在脚本文件中写的:

#!/bin/bash

directory="/home/flip/Desktop"
suffix="in"

browsefolders ()
  for i in "$1"/*; 
  do
    echo "dir :$directory"
    echo "filename: $i"
    #   echo ${i#*.}
    extension=`echo "$i" | cut -d'.' -f2`
    echo "Erweiterung $extension"
    if     [ -f "$i" ]; then        

        if [ $extension == $suffix ]; then
            echo "$i ends with $in"

        else
            echo "$i does NOT end with $in"
        fi
    elif [ -d "$i" ]; then  
    browsefolders "$i"
    fi
  done
}
browsefolders  "$directory"
Run Code Online (Sandbox Code Playgroud)

不幸的是,当我在终端中启动这个脚本时,它说:

[: 29: in: unexpected operator
Run Code Online (Sandbox Code Playgroud)

($extension而不是'in')

这里发生了什么,错误在哪里?但是这个大括号

Mat*_*Mat 709

find $directory -type f -name "*.in"
Run Code Online (Sandbox Code Playgroud)

比整个事情要短一些(更安全 - 处理文件名和目录名中的空格).

对于.名称中没有名称的条目,您的脚本可能会失败$extension.

  • 是的,`find`默认是递归的.如果需要,可以限制深度(参见手册页). (13认同)
  • @flip:这是一个不同的问题.发布一个新问题,详细说明您想要做什么以及到目前为止您尝试过的内容. (6认同)
  • @Shnatsel:双引号确实可以防止shell扩展.试试看. (3认同)

Moh*_*neh 165

find {directory} -type f -name '*.extension'
Run Code Online (Sandbox Code Playgroud)

示例 查找当前目录及其子目录中的所有csv文件

find . -type f -name '*.csv'
Run Code Online (Sandbox Code Playgroud)


Sco*_*son 58

我使用的语法与@Matt建议的有点不同:

find $directory -type f -name \*.in
Run Code Online (Sandbox Code Playgroud)

(这是一个较少的击键).

  • @Shnatsel这个评论(因此你的评论)是完全错误的. (4认同)
  • 在讨论中提供参考总是一个好方法,它不取决于谁是第一个。他应该,你应该。 (2认同)

小智 12

不使用find:

du -a $directory | awk '{print $2}' | grep '\.in$'
Run Code Online (Sandbox Code Playgroud)

  • 这里不需要`grep`.`awk`有正则表达式,可以将其输出限制为与模式匹配的值. (3认同)

Jen*_*ens 10

  1. 之后有一个{失踪browsefolders ()
  2. 一切$in都应该$suffix
  3. 这条线cut让你只有中间部分front.middle.extension.你应该阅读你的shell手册${varname%%pattern}和朋友.

我假设您将此作为shell脚本的练习,否则find已经提出的解决方案是可行的方法.

要在不运行脚本的情况下检查正确的shell语法,请使用sh -n scriptname.


Ini*_*ian 9

尽管使用find命令在这里很有用,但外壳本身提供了无需任何第三方工具即可实现此要求的选项。该bash外壳提供了使用扩展的水珠支持选项,您可以在递归路径获得的文件名那场比赛你想要的扩展。

扩展选项extglob需要使用如下shopt选项进行设置。这些选项通过-ssupport启用,通过 he-u标志禁用。此外,您可以使用更多选项,即nullglob其中一个不匹配的 glob 被完全清除,替换为一组零字。并globstar允许通过的所有目录递归

shopt -s extglob nullglob globstar
Run Code Online (Sandbox Code Playgroud)

现在您需要做的就是形成 glob 表达式以包含特定扩展名的文件,您可以按如下方式执行。我们使用一个数组来填充 glob 结果,因为当正确引用和扩展时,带有特殊字符的文件名将保持完整,不会由于 shell 的分词而被破坏。

例如列出*.csv递归路径中的所有文件

fileList=(**/*.csv)
Run Code Online (Sandbox Code Playgroud)

选项**是通过子文件夹递归,并且*.csv是全局扩展以包含提到的扩展名的任何文件。现在要打印实际文件,只需执行

printf '%s\n' "${fileList[@]}"
Run Code Online (Sandbox Code Playgroud)

在 shell 脚本中使用数组并进行适当的带引号扩展是正确的方法,但对于交互式使用,您可以简单地ls将 glob 表达式用作

ls -1 -- **/*.csv
Run Code Online (Sandbox Code Playgroud)

这可以很好地扩展以匹配多个文件,即以多个扩展名结尾的文件(即类似于在find命令中添加多个标志)。例如,考虑需要获取所有递归图像文件即扩展名的情况*.gif*.png并且*.jpg,您需要做的就是

ls -1 -- **/+(*.jpg|*.gif|*.png)
Run Code Online (Sandbox Code Playgroud)

这也可以很好地扩展为否定结果。使用相同的语法,可以使用 glob 的结果来排除某种类型的文件。假设您想排除具有上述扩展名的文件名,您可以这样做

excludeResults=()
excludeResults=(**/!(*.jpg|*.gif|*.png))
printf '%s\n' "${excludeResults[@]}"
Run Code Online (Sandbox Code Playgroud)

该构造!()是一个否定操作,不包括其中列出的任何文件扩展名,并且|是一个替代运算符,就像在扩展正则表达式库中用于对 glob 进行 OR 匹配一样。

请注意,这些扩展的 glob 支持在 POSIX bourne shell 中不可用,并且它完全特定于bash. 因此,如果您正在考虑跨 POSIX 和bashshell运行的脚本的可移植性,则此选项不正确。


kip*_*ip2 9

find "$PWD" -type f -name "*.in"
Run Code Online (Sandbox Code Playgroud)


小智 6

要查找pom.xml当前目录中的所有文件并打印它们,您可以使用:

find . -name 'pom.xml' -print
Run Code Online (Sandbox Code Playgroud)