在bash中，如何计算一组中每个单词在多个文件中的出现

半生

我有一个很大的单词列表（> 1000），它们实际上是文件名，并且包含很多源代码文件（> 2000）。我想为列表中的每个单词（文件名）计算其在目录的所有文件中的总出现次数。我目前正在做的是：

#!/bin/sh
SEARCHPATH=$1
for var in "${@:2}"
do
    BASE=$( basename "$var" )
    COUNT=$(grep -o "$BASE" $SEARCHPATH/* | wc -l)
    echo -e "$BASE:" " $COUNT"
done

这种方法有效，但效率低下，因为对于每个单词，它都会搜索整个目录，并且单词太多。我正在寻找一种扫描目录一次，累积字数的解决方案。

狗b

将您所有的单词都放在一个文件中。然后，您可以尝试以下操作：

grep -ohFf wordsFile path/* | sort | uniq -c

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-19

我来说两句

0 条评论

登录后参与评论

计算r中一组单词中的出现次数

如何计算一组单词以任何顺序出现在列中的次数？

如何计算一组单词在t-sql中的给定数据中出现的次数？

如何从Unix或Linux的一组文件中的哪个文件中查找单词集中的任何单词？

一组字符串中每个单词的频率

在bash中，如何计算一组中每个单词在多个文件中的出现

在bash中，如何计算一组中每个单词在多个文件中的出现

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Java Eclipse中的错误13，如何解决？

在Windows 7中无法删除文件（2）

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

套接字无法检测到断开连接

带有错误“ where”条件的查询如何返回结果？

有什么解决方案可以将android设备用作Cast Receiver？

Mac OS X更新后的GRUB 2问题

ggplot：对齐多个分面图-所有大小不同的分面

验证REST API参数

如何从视图一次更新多行（ASP.NET - Core）

尝试反复更改屏幕上按钮的位置 - kotlin android studio

计算数据帧中每行的NA

检索角度选择div的当前值

离子动态工具栏背景色

UITableView的项目向下滚动后更改颜色，然后快速备份

VB.net将2条特定行导出到DataGridView

蓝屏死机没有修复解决方案

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException