如何将文件信息存储到数组中？

user205638 发表于 Dev

205

通过脚本的这一部分，我可以获得有关目录（和子目录）中文件的必要信息。我唯一需要的信息是文件的扩展名和大小。

for file in `find . -type f`; do
   size=$(stat -c '%s' ${file})
   file=$(echo "${file}" | awk -F/ '{print $NF}')
   ext=$(echo "${file}" | grep '..*\.' | awk -F. '{print $NF}' | grep '[A-Za-z0-9]')
if [ -z ${ext} ]; then
   echo "NOTE: no extention"
else
   EXTS="${EXTS}${ext}${newLine}"

它只是脚本的一部分。所以我的问题是：如何将这个信息放入数组中？我的意思是我想要一个包含元素的数组看起来像这样：

 c/123 /12 h/90 /0 txt/0

其中c，h和txt是文件扩展名，123、12和0是文件大小。因此，最近我可以分别使用大小和扩展名
，希望我已经将问题巧妙地解决了。对不起，错了。:)

muru

首先，不要做for file in $(find …)。那是非常脆弱的。

现在，您可以使用-printf以下命令找到一起打印文件名和大小的方法，从而稍微简化代码：

find . -type f -printf '%s.%f/'

然后，您可以使用awk来处理此输出，以按扩展名获取累积大小。请注意，我过去通常.将文件名（%f）和大小（%s）分开，并在/其后添加了一个。因此，我可以.在中用作字段分隔符awk。由于文件名中唯一不允许使用的字符是/ASCII NUL，因此我可以放心/用作记录分隔符。

所以：

awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next}
  {size["/"] += $1}
END {for (i in size) {print i,"/",size[i]}'

在这里，/如果没有扩展名，我将用作索引。

合并：

$ find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next}
{size["/"] += $1}
END {for (i in size) {printf "%s/%d\n", i, size[i]}}'
h/780
md/2509
tex/23961
c/13557
//5109
txt/2349291
sh/1166
py/12248

现在，如果您的扩展名不包含空格，则可以执行以下操作：

my_array=( $(find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next} {size["/"] += $1} END {for (i in size) {printf "%s/%d\n", i, size[i]}}') )

或者，您可以使用流程替换并读取以下各项中的每个条目：

my_arr=()
while IFS='' read -r entry
do
    my_arr+=( "$entry" )
done < <(find . -type f -printf '%s.%f/' | awk -F. -v RS=/ 'NF > 2 {size[$NF] += $1; next} {size["/"] += $1} END {for (i in size) {printf "%s/%d\n", i, size[i]}}')

像之前一样：

$ printf "%s\n" "${my_arr[@]}"
h/780
md/2509
tex/23961
c/13557
//5109
txt/2349291
sh/1166
py/12248

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-04-2

我来说两句

0 条评论

登录后参与评论

上一篇：使用pip在MacOS High Sierra上安装s3cmd

如何将文件信息存储到数组中？

如何将文件信息存储到数组中？

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何正确比较 scala.xml 节点？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

在令牌内联程序集错误之前预期为 ')'

数据表中有多个子行，asp.net核心中来自sql server的数据

VBA 自动化错误：-2147221080 (800401a8)

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何在JavaScript中获取数组的第n个元素？

检查嵌套列表中的长度是否相同

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

ES5的代理替代

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

如何监视应用程序而不是单个进程的CPU使用率？

如何检查字符串输入的格式

解决类Koin的实例时出错

如何自动选择正确的键盘布局？-仅具有一个键盘布局