我有一个压缩文件Data.zip
(如果未压缩)包含许多文件:
file_1.txt
file_2.txt
...
...
Run Code Online (Sandbox Code Playgroud)
我想要一个 CLI 命令将其转换为一个新文件夹Data_zipped
,其中包含Data.zip
未压缩的单个文件:
Data_zipped/file_1.zip
Data_zipped/file_2.zip
...
...
Run Code Online (Sandbox Code Playgroud)
但诀窍是它Data.zip
包含如此多的文件(而且它们总体上如此之大),以至于我无法先解压缩 Data.zip,然后一举压缩其中的单个文件:这一切都必须“即时”发生:
对于所有文件 Data.zip/
name_of_that_file.zip
Data_zipped
如何使用 CLI 做到这一点?
我修改了@George 的超清晰脚本,以帮助更好地解释文件夹结构:
file_1.txt
file_2.txt
...
...
Run Code Online (Sandbox Code Playgroud)
当我运行它时,我得到(我使用一个只有几个文件的令牌 Data.zip,但你明白了):
./GU_script.sh Data.zip
Archive: Data.zip
Length Date Time Name
--------- ---------- ----- ----
0 2017-11-21 22:58 Data/
120166309 2017-11-21 14:58 Data/Level1_file.csv
120887829 2017-11-21 14:58 Data/Level1_other_file.csv
163772796 2017-11-21 14:59 Data/Level1_yet_other_file.csv
193519556 2017-11-21 14:59 Data/Level1_here_is_another_file.csv
153798779 2017-11-21 14:59 Data/Level1_so_many_files.csv
131918225 2017-11-21 14:59 Data/Level1_many_more_to_go.csv
--------- -------
884063494 7 files
5
Run Code Online (Sandbox Code Playgroud)
所以基本上,我希望将Level1_file.csv
其他文件单独压缩(-> Level1_file.zip)并放入一个文件夹中。
我最终结合了@George 和@David Foerster 的回答:
#!/bin/bash
#Name of zip file
filename="$1"
# Check if valid zip file is passed
if file "$filename" | grep -wq "Zip archive data";
then
#!/bin/bash
src="$filename"
dst=.
LC_ALL=C unzip -l "$src" |
sed -re '1,/^-{6}/d; /^-{6}/,$d; /\/$/d; s/^\s*(\S+\s+){3}//' |
while IFS= read -r f; do
out="${f##*/}"; out="$dst/${f%%/*}_zipped/${out%.*}.zip"
if [ ! -d "${out%/*}" ]; then
mkdir -p "${out%/*}" || break
fi
zip --copy "$src" --out "$out" "$f" || break
done
else
echo "Invalid file type: \"zip\" file required"
exit 1
fi
Run Code Online (Sandbox Code Playgroud)
您可以使用“复制”操作zip(1)
和一些文件路径修改。它的优点是可以将压缩的数据流直接复制到目标存档,而无需间歇性解压。
#!/bin/bash
src=Data.zip
dst=.
LC_ALL=C unzip -l "$src" |
sed -re '1,/^-{6}/d; /^-{6}/,$d; /\/$/d; s/^\s*(\S+\s+){3}//' |
while read -r f; do
out="${f##*/}"; out="$dst/${f%%/*}_zipped/${out%.*}.zip"
if [ ! -d "${out%/*}" ]; then
mkdir -p "${out%/*}" || return
fi
zip --copy "$src" --out "$out" "$f" <&- || return
done
Run Code Online (Sandbox Code Playgroud)
我添加LC_ALL=C
了调用,unzip
因为它的输出格式在不同的实现中看起来有点不稳定,我想至少避免依赖于语言环境的输出变体。