从JSON重命名无效的密钥

639

拉克什·普拉萨德（Rakesh Prasad）

我在NIFI中有以下流程，JSON中有（1000+）个对象。

invokeHTTP->SPLIT JSON->putMongo

流工作正常，直到我在json中收到带有“。”的键为止。在名字里。例如“ spark.databricks.acl.dfAclsEnabled”。

我当前的解决方案不是最佳解决方案，我记下了错误的键，并使用多个替换文本处理器替换了“”。与“ _”。我不使用REGEX，而是使用字符串文字查找/替换。因此，每当我在putMongo处理器中遇到故障时，我都会插入新的replaceText处理器。

这是无法维持的。我想知道是否可以使用JOLT？关于输入JSON的一些信息。

1）没有固定的结构，只有被确认的东西。一切都会在事件数组中。但是事件对象本身是自由形式。

2）最大列表大小= 1000。

3）第三方JSON，所以我不能要求更改格式。

另外，带有“。”的键可以出现在任何地方。因此，我正在寻找可以在所有级别清除然后重命名的JOLT规范。

{
  "events": [
    {
            "cluster_id": "0717-035521-puny598",
            "timestamp": 1531896847915,
            "type": "EDITED",
            "details": {
                "previous_attributes": {
                    "cluster_name": "Kylo",
                    "spark_version": "4.1.x-scala2.11",
                    "spark_conf": {
                        "spark.databricks.acl.dfAclsEnabled": "true",
                        "spark.databricks.repl.allowedLanguages": "python,sql"
                    },
                    "node_type_id": "Standard_DS3_v2",
                    "driver_node_type_id": "Standard_DS3_v2",
                    "autotermination_minutes": 10,
                    "enable_elastic_disk": true,
                    "cluster_source": "UI"
                },
                "attributes": {
                    "cluster_name": "Kylo",
                    "spark_version": "4.1.x-scala2.11",
                    "node_type_id": "Standard_DS3_v2",
                    "driver_node_type_id": "Standard_DS3_v2",
                    "autotermination_minutes": 10,
                    "enable_elastic_disk": true,
                    "cluster_source": "UI"
                },
                "previous_cluster_size": {
                    "autoscale": {
                        "min_workers": 1,
                        "max_workers": 8
                    }
                },
                "cluster_size": {
                    "autoscale": {
                        "min_workers": 1,
                        "max_workers": 8
                    }
                },
                "user": ""
            }
        },
    {
      "cluster_id": "0717-035521-puny598",
      "timestamp": 1535540053785,
      "type": "TERMINATING",
      "details": {
        "reason": {
          "code": "INACTIVITY",
          "parameters": {
            "inactivity_duration_min": "15"
          }
        }
      }
    },
    {
      "cluster_id": "0717-035521-puny598",
      "timestamp": 1535537117300,
      "type": "EXPANDED_DISK",
      "details": {
        "previous_disk_size": 29454626816,
        "disk_size": 136828809216,
        "free_space": 17151311872,
        "instance_id": "6cea5c332af94d7f85aff23e5d8cea37"
      }
    }
  ]
}

安迪

我创建一个模板使用ReplaceText，并RouteOnContent执行此任务。循环是必需的，因为正则表达式仅.在每次传递时替换JSON密钥中的第一个。您也许可以优化此方法以在一次通过中执行所有替换，但是在将正则表达式与前瞻性组和后视组模糊化几分钟之后，重新路由会更快。我验证了它可以与您提供的JSON一起使用，也可以与JSON和不同行:上的键和值一起使用（在任一行上）：

...
"spark_conf": {
                        "spark.databricks.acl.dfAclsEnabled":
 "true",
                        "spark.databricks.repl.allowedLanguages"
: "python,sql"
                    },
...

您还可以使用ExecuteScript带有Groovy的处理器来提取JSON，快速过滤包含的所有JSON密钥.，执行collect操作以进行替换，以及如果您希望单个处理器在JSON数据中重新插入密钥，单通。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-28

我来说两句

0 条评论

登录后参与评论

上一篇：Kivy Python TextInput显示气泡

TOP 榜单

文章

从JSON重命名无效的密钥

从JSON重命名无效的密钥

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接