如何提取R中单词子集的词频?

纳门洛斯

我有一个数据框,其中一列包含大约 10,000 个单词,而另一列包含它们相应的频率。我还有一个大约 600 个单词的向量。600 个字中的每一个都是数据帧中的一个字。如何从 10,000 字数据框中查找 600 字向量的频率?

甜蜜的音乐

usedplyr的连接函数。

# make the 600 vector into a dataframe
600_df <- as.data.frame(600_vec)

# left join the two dataframes
df <- left_join(x = 600_df, y = 10000_df, by = "word")

其中“word”是两个数据帧之间的变量名常量

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章