我在一个文件夹中有10000个文件,我想知道哪个文件是重复的。我只想将它们的名称保存在txt文件中
有什么办法吗?
我的文件看起来像这样。举个例子
..._P2_A1-(01)_....tx
对我来说,当我有第一部分两次时,这是双重的 QEX2_P2_A1
我曾尝试打印出来,但没有成功的例子,这里是一个解决方案的Bash:如何打印第n个文件的文件名的文件夹或Bash中提取文件名和扩展它没有为我工作。我试图搜索它,但找不到任何解决方案
您可以printf + awk
用来打印所有部分重复的文件名:
printf "%s\n" *.txt | awk -F '_' '{k=$1 FS $2 FS $3} k in seen{dups[seen[k]]=k; dups[$0]=k}
{seen[k]=$0} END{for (f in dups) print dups[f] " => " f}'
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句