使用 Logstash 从文本文件中提取数据并导入 Elasticsearch

尼蒂什·库马尔

我有一个需要导入 Elasticsearch 的文本文件。我的文本文件格式是：

1            ARsv200711042           Allen                         Alane                         
2            ARsv200711042           Allen                         Arthur                        
3            ARsv200711042           Allen                         Bernice                       
4            ARsv200711042           Allen                         Betty                         
5            ARsv200711042           Allen                         Brittany                      
6            ARsv200711042           Allen                         Bruce                         
7            ARsv200711042           Allen                         Carolyn                       
8            ARsv200711042           Allen                         Carolyn                       
9            ARsv200711042           Allen                         Chadderick                    
10           ARsv200711042           Allen                         Darlene

我需要获取有关职位的数据；例如，第一列是 eMID，从第 1 位到第 13 位，我的 StateSource 位于第 14-15 位，CodeProducts 位于第 16-17 位，依此类推。

所以我做了这样的 Logstash 配置：

input {
    file {
        path => "D:/sample/sample 500.txt"
        start_position => "beginning"
    }
}

filter {
    grok {
        match => { 
            "message" => [
                "(?<eMID>.{0,13})(?<StateSource>.{0,2})(?<CodeProducts>.{0,2})(?<AcquiredDate>.{0,8})(?<Uses>.{0,2})(?<Prefix>.{0,10})(?<LName>.{0,30})(?<FName>.{0,30})"
            ]
        }
    }
}

output {
  elasticsearch {
    hosts => ["http://localhost:9200"]
    index => "sample-data"
    #user => "elastic"
    #password => "changeme"
  }
}

我能够成功导入数据。我有以下问题：

如何格式化日期字段，例如。我已经获取了20071104需要转换为日期格式的日期格式，elasticsearch可以分析
由于我们正在持仓，因此可能会出现很多尾随空格，如何修剪这些空格。
在某些情况下，例如一些列。Firstname/FName或者Lastname/LName可能包含特殊字符，例如+ - && || ! ( ) { } [ ] ^ " ~ * ? : \等，我怎样才能将那些与正则表达式匹配并插入到 elasticsearch 中。

JBone

好的，一种方法是将其20071104分成四部分\d{4}并将其分配给 y，将接下来的两位数字分配\d{2}给 m，将剩余的两位数字\d{2}分配给 d 并构建一个日期对象

或者第二种方法是从字符串创建一个日期并使用该对象重新格式化，就像我在这个例子中所做的那样，假设 AcquiredDate 是 20071104

filter {
     
      ruby {
           code => '
                 date = Date.strptime(event.get("AcquiredDate"), "%Y%m%d")
                 event.set("new_time", date.strftime("%Y-%m-%d"))
           '
      }
      mutate {
         remove_field =>
                       ["host","@timestamp","sequence","message","@version"]
      }
 }

给你

{
    "AcquiredDate" => "20071104",
    "new_time" => "2007-11-04"
}

回答你的第二部分

使用这样的东西

mutate { 
  strip => ["field1withwhitespace", "field2withwhitespace"] 
}

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-09-3

我来说两句

0 条评论

登录后参与评论

上一篇：结构指针 - 使用指针访问结构数组

使用 Logstash 从文本文件中提取数据并导入 Elasticsearch

使用 Logstash 从文本文件中提取数据并导入 Elasticsearch

IE 11中的FormData未定义

如何一次从多个文本框中获取值？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

OpenCv：改变 putText() 的位置

Redux动作正常，但减速器无效

如何从JavaScript中的MP3文件读取元数据属性？

如何使用Redux-Toolkit重置Redux Store

将加号/减号添加到jQuery菜单

OpenGL纹理格式的颜色错误

获取并汇总所有关联的数据

超过时间限制错误C ++

ActiveModelSerializer仅显示关联的ID

在交互式Python Shell中获得最后结果

如何开始为Ubuntu开发

去噪自动编码器和常规自动编码器有什么区别？

Excel 2016图表将增长与4个参数进行比较

算术中的c ++常量类型转换

使用因子时如何在y轴上的ggplot中插入count或％

TreeMap中的自定义排序

如何在R中转置数据

在 React Native Expo 中使用 react-redux 更改另一个键的值