我知道可搜索字段的 Azure 搜索索引会为每个分析的术语创建一个倒排索引,但无法在文档中找到是否存储了每个术语的术语频率。
问题Azure 搜索是否将可搜索字段的词频存储在某处?当它只需要计算一次时,似乎为每个搜索查询计算它似乎是低效的。
如果是这样,是否可以为单独的处理步骤提取/下载整个数据集的词频?
我们确实维护术语频率以快速计算诸如 TF/IDF 之类的东西。不幸的是,目前无法从 Azure 搜索中获取该信息。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句