fli*_*lip 402 linux bash recursion
我正在尝试使用我的bash(最新的Ubuntu LTS版本)在目录及其子目录中查找具有特定扩展名的所有文件.
这是在脚本文件中写的:
#!/bin/bash
directory="/home/flip/Desktop"
suffix="in"
browsefolders ()
for i in "$1"/*;
do
echo "dir :$directory"
echo "filename: $i"
# echo ${i#*.}
extension=`echo "$i" | cut -d'.' -f2`
echo "Erweiterung $extension"
if [ -f "$i" ]; then
if [ $extension == $suffix ]; then
echo "$i ends with $in"
else
echo "$i does NOT end with $in"
fi
elif [ -d "$i" ]; then
browsefolders "$i"
fi
done
}
browsefolders "$directory"
Run Code Online (Sandbox Code Playgroud)
不幸的是,当我在终端中启动这个脚本时,它说:
[: 29: in: unexpected operator
Run Code Online (Sandbox Code Playgroud)
($extension而不是'in')
这里发生了什么,错误在哪里?但是这个大括号
Mat*_*Mat 709
find $directory -type f -name "*.in"
Run Code Online (Sandbox Code Playgroud)
比整个事情要短一些(更安全 - 处理文件名和目录名中的空格).
对于.名称中没有名称的条目,您的脚本可能会失败$extension.
Moh*_*neh 165
find {directory} -type f -name '*.extension'
Run Code Online (Sandbox Code Playgroud)
示例 查找当前目录及其子目录中的所有csv文件
find . -type f -name '*.csv'
Run Code Online (Sandbox Code Playgroud)
Sco*_*son 58
我使用的语法与@Matt建议的有点不同:
find $directory -type f -name \*.in
Run Code Online (Sandbox Code Playgroud)
(这是一个较少的击键).
小智 12
不使用find:
du -a $directory | awk '{print $2}' | grep '\.in$'
Run Code Online (Sandbox Code Playgroud)
Jen*_*ens 10
{失踪browsefolders ()$in都应该$suffixcut让你只有中间部分front.middle.extension.你应该阅读你的shell手册${varname%%pattern}和朋友.我假设您将此作为shell脚本的练习,否则find已经提出的解决方案是可行的方法.
要在不运行脚本的情况下检查正确的shell语法,请使用sh -n scriptname.
尽管使用find命令在这里很有用,但外壳本身提供了无需任何第三方工具即可实现此要求的选项。该bash外壳提供了使用扩展的水珠支持选项,您可以在递归路径获得的文件名那场比赛你想要的扩展。
扩展选项extglob需要使用如下shopt选项进行设置。这些选项通过-ssupport启用,通过 he-u标志禁用。此外,您可以使用更多选项,即nullglob其中一个不匹配的 glob 被完全清除,替换为一组零字。并globstar允许通过的所有目录递归
shopt -s extglob nullglob globstar
Run Code Online (Sandbox Code Playgroud)
现在您需要做的就是形成 glob 表达式以包含特定扩展名的文件,您可以按如下方式执行。我们使用一个数组来填充 glob 结果,因为当正确引用和扩展时,带有特殊字符的文件名将保持完整,不会由于 shell 的分词而被破坏。
例如列出*.csv递归路径中的所有文件
fileList=(**/*.csv)
Run Code Online (Sandbox Code Playgroud)
选项**是通过子文件夹递归,并且*.csv是全局扩展以包含提到的扩展名的任何文件。现在要打印实际文件,只需执行
printf '%s\n' "${fileList[@]}"
Run Code Online (Sandbox Code Playgroud)
在 shell 脚本中使用数组并进行适当的带引号扩展是正确的方法,但对于交互式使用,您可以简单地ls将 glob 表达式用作
ls -1 -- **/*.csv
Run Code Online (Sandbox Code Playgroud)
这可以很好地扩展以匹配多个文件,即以多个扩展名结尾的文件(即类似于在find命令中添加多个标志)。例如,考虑需要获取所有递归图像文件即扩展名的情况*.gif,*.png并且*.jpg,您需要做的就是
ls -1 -- **/+(*.jpg|*.gif|*.png)
Run Code Online (Sandbox Code Playgroud)
这也可以很好地扩展为否定结果。使用相同的语法,可以使用 glob 的结果来排除某种类型的文件。假设您想排除具有上述扩展名的文件名,您可以这样做
excludeResults=()
excludeResults=(**/!(*.jpg|*.gif|*.png))
printf '%s\n' "${excludeResults[@]}"
Run Code Online (Sandbox Code Playgroud)
该构造!()是一个否定操作,不包括其中列出的任何文件扩展名,并且|是一个替代运算符,就像在扩展正则表达式库中用于对 glob 进行 OR 匹配一样。
请注意,这些扩展的 glob 支持在 POSIX bourne shell 中不可用,并且它完全特定于bash. 因此,如果您正在考虑跨 POSIX 和bashshell运行的脚本的可移植性,则此选项不正确。
小智 6
要查找pom.xml当前目录中的所有文件并打印它们,您可以使用:
find . -name 'pom.xml' -print
Run Code Online (Sandbox Code Playgroud)