在bash中,如何计算一组中每个单词在多个文件中的出现

半生

我有一个很大的单词列表(> 1000),它们实际上是文件名,并且包含很多源代码文件(> 2000)。我想为列表中的每个单词(文件名)计算其在目录的所有文件中的总出现次数。我目前正在做的是:

#!/bin/sh
SEARCHPATH=$1
for var in "${@:2}"
do
    BASE=$( basename "$var" )
    COUNT=$(grep -o "$BASE" $SEARCHPATH/* | wc -l)
    echo -e "$BASE:" " $COUNT"
done

这种方法有效,但效率低下,因为对于每个单词,它都会搜索整个目录,并且单词太多。我正在寻找一种扫描目录一次,累积字数的解决方案。

狗b

将您所有的单词都放在一个文件中。然后,您可以尝试以下操作:

grep -ohFf wordsFile path/* | sort | uniq -c

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

计算r中一组单词中的出现次数

如何计算一组单词以任何顺序出现在列中的次数?

如何计算一组单词在t-sql中的给定数据中出现的次数?

如何从Unix或Linux的一组文件中的哪个文件中查找单词集中的任何单词?

一组字符串中每个单词的频率

在一组 pdf 文件中查找单词或一组单词

在 bash 中,我想根据一组单词为每个单词生成一组固定的 4 个字符输出并始终匹配

计算唯一组组合中的出现次数

计算一组条件在时间序列中的出现次数

如何从python列表中的CSV文件的单个单元格中写入一组单词?

如何从一组单词中获取特定字母出现的次数

如何从字符串中抓取一组单词?

如何从字符串中获取一组单词?

如何为每个句子分数计算一个句子中每个单词的出现次数?

Pyspark如何计算每个组中字符串的出现次数并打印多个选定的列?

如何逐字阅读但给每个单词一个值,以及在python中的公共和一组数量之间

如何从Racket中的文件中读取一组数据?

计算一组中的点数 - Highcharts

如何计算每个文档每行一个标记中的单词/标记的出现次数

在多个文件中查找以一组特定字符开头的单词,并用另一个单词替换整个单词

如何用C中的一组目标文件编译一组C文件

如何在一组行中返回多个值。

如何计算在作为参数传递的所有“ n”个文件中,文件中每个单词的出现次数?

如何在.txt文件中一组下一行单词中的点后下一行

如何计算数字是否在数组中的每个组中出现一次

如何计算sql查询中多个单词的出现次数

PHP-检查单词是否在一组单词中

如何为同一文件路径中的每个文件分别执行同一组命令?

计算R中的一组变量中的值的出现次数(每行)-带有权重