如何使用Elasticsearch对视图内容编制索引?

卡姆登·纳兹特(Camden Narzt)

我有一个控制器,它显示几个视图,但没有模型支持,这些视图只是从erb渲染为html

我需要做的是从这些视图中获取在Elasticsearch中建立索引的文本,但是我遇到了相关文档不足的问题。

另一个复杂的因素是视图已翻译,因此它们不直接包含其文本。

我该怎么做才能使这些页面编入索引并可以搜索?既然不能依靠activerecord回调,应该如何维护索引?

卡姆登·纳兹特(Camden Narzt)

基于抓取网站的想法的解决方案:

在WelcomeController中:

format.json { render json: {body:view_to_text(view), title:@title, url:request.original_url.gsub(/\.json$/,'')} }
...
def view_to_text(view)
  html = render_to_string view, layout: false, formats: :html
  strip_tags(html).strip.gsub(/^[\s]+/,'').squeeze("\n")
end

并在rake任务中:

require 'open-uri'

namespace :scrape do
  desc "scrape view content and send to elasticsearch"
  task scrape: :environment do
    client = Elasticsearch::Model.client
    session = ActionDispatch::Integration::Session.new(Rails.application)
    session.host! Rails.application.config.action_mailer.default_url_options[:host]

    Rails.application.routes.routes.to_a.select{|r| r.defaults[:controller] == 'welcome'}.map{|r| r.path.spec.to_s.gsub( /\(\.\:format\)/, '.json') }.reject{|r| '/'==r}.each_with_index{|path,i|
      session.get path
      page_string = session.response.body
      client.index  index: Rails.env, type: 'welcome', id: i, body: page_string
    }
  end

end

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何加快ElasticSearch索引编制速度?

Elasticsearch中的索引编制

如何使用Elasticsearch提取附件插件为pdf文件编制索引?

Elasticsearch如何使用命令行为文本文件编制索引

如何根据子视图内容增加视图高度

如何在Elasticsearch中停止重新索引编制?

如何通过Java API在ElasticSearch中重新编制索引

ElasticSearch-使用Java API为大型文件编制索引

使用Python UTF-8问题进行Elasticsearch索引编制

如何使用“ getOwnPropertyNames”遍历地图内容

如何根据文本视图内容 Swiftui 管理 Scrollview 高度

如何在iOS中计算Web视图内容的高度?

Android:如何使用矩阵对视图进行动画处理?

我如何对视图集使用极限偏移分页

如何使用摄取附件插件和JavaScript客户端在Elasticsearch 6.1中为PDF编制索引?

视图内的Angularjs JSON内容

使用局部视图在同一视图中创建和编制索引

Elasticsearch-什么是索引编制过程?

Python Elasticsearch 7.05索引编制失败

检查Elasticsearch是否已完成索引编制

Elasticsearch重新编制索引竞争条件

如何根据文本视图内容大小在滚动视图中设置启用或禁用滚动?

如何在视图内部使用返回重定向?

Logstash编制索引时如何在Elasticsearch中修复重复的文档?

如何将数据存储在elasticsearch _source中而不对其编制索引?

通过Java代码在Elasticsearch中使用inguest-attachment插件为pdf / word编制索引

Elasticsearch-什么更快?为相同的文档编制索引或使用detect_noop更新:是吗?

并非所有文档都使用ElasticSearch和MongoDB编制了索引

尝试使用Kafka Connect在Elasticsearch中为Kafka主题编制索引