重命名多个文件,通过“_”分割文件名并保留第一个和最后一个字段
假设我有以下文件:
a_b.txt a_b_c.txt a_b_c_d_e.txt a_b_c_d_e_f_g_h_i.txt
我想以这样的方式重命名它们,我将它们的文件名分开_并保留第一个和最后一个字段,所以我最终得到:
a_b.txt a_c.txt a_e.txt a_i.txt
以为这很容易,但我有点卡住了......
我尝试rename使用以下正则表达式:
rename 's/^([^_]*).*([^_]*[.]txt)/$1_$2/' *.txt
但是我真正需要做的是实际拆分文件名,所以我想到了awk,但我对它并不那么精通......这就是我目前所拥有的(我知道在某些时候我应该指定FS="_"并抓住第一个和最后一个字段不知何故......
find . -name "*.txt" | awk -v mvcmd='mv "%s" "%s"\n' '{old=$0; <<split by _ here somehow and retain first and last fields>>; printf mvcmd,old,$0}'
有什么帮助吗?我没有首选方法,但使用它来学习会很好awk。谢谢!
回答
你的rename尝试很接近;你只需要确保最后一组是贪婪的。
rename 's/^([^_]*).*_([^_]*[.]txt)$/$1_$2/' *_*_*.txt
我_在最后一个左括号之前添加了一个(这是关键的修复),并在最后添加了一个$锚点,并且还扩展了通配符,这样您就不会处理任何不包含至少两个下划线的文件。
awk 中的等价物可能看起来像
find . -name "*_*_*.txt" |
awk -F _ '{ system("mv " $0 " " $1 "_" $(NF)) }'
由于system调用,这有点脆弱;如果您的文件名可能包含空格或其他 shell 元字符,您可能需要重新考虑您的方法。您可以添加引号以部分修复该问题,但是如果文件名包含文字引号,则该命令将失败。你也可以解决这个问题,但是这对我来说有点太复杂了。
这是一种不那么脆弱的方法,它应该处理完全任意的文件名,即使是带有换行符的文件名:
find . -name "*_*_*.txt" -exec sh -c 'for f; do
mv "$f" "${f%%_*}_${f##*_}"
done' _ {} +
find将在每个文件名之前提供一个前导路径,所以我们不需要mv --这里(永远不会有一个以破折号开头的文件名)。
的参数扩展 ${f##pattern}产生变量的值f与上最长的可用匹配pattern从开始修整掉; ${f%%pattern}做同样的事情,但从字符串的末尾修剪。