serde：加速自定义枚举反序列化

用户名

我的程序解析了足够大的json文档（30MB），在CPU速度较慢的机器上需要70毫秒，我想加快该过程，我发现27％的解析都发生在我的文档中foo_document_type_deserialize，是否有可能改善此功能，可能是有办法跳过String此配置：let s = String::deserialize(deserializer)?;？

我完全确定表示枚举值的字符串不包含特殊的json字符，例如\b \f \n \r \t \" \\，因此使用未转义的字符串应该是安全的。

use serde::{Deserialize, Deserializer};

#[derive(Deserialize, Debug, Clone)]
#[serde(rename_all = "camelCase")]
pub struct FooDocument {
    // other fields...
    #[serde(rename = "type")]
    #[serde(deserialize_with = "foo_document_type_deserialize")]
    doc_type: FooDocumentType,
}

fn foo_document_type_deserialize<'de, D>(deserializer: D) -> Result<FooDocumentType, D::Error>
where
    D: Deserializer<'de>,
{
    use self::FooDocumentType::*;
    let s = String::deserialize(deserializer)?;
    match s.as_str() {
        "tir lim bom bom" => Ok(Var1),
        "hgga;hghau" => Ok(Var2),
        "hgueoqtyhit4t" => Ok(Var3),
        "Text" | "Type not detected" | "---" => Ok(Unknown),
        _ => Err(serde::de::Error::custom(format!(
            "Unsupported foo document type '{}'",
            s
        ))),
    }
}

#[derive(Debug, Clone, Copy)]
pub enum FooDocumentType {
    Unknown,
    Var1,
    Var2,
    Var3,
}

托尔奈

您编写的自定义隐式格式以serde_derive可以生成的形式：

#[derive(Deserialize, Debug)]
pub enum FooDocumentType {
    #[serde(rename = "Text", alias = "Type not detected", alias = "---")]
    Unknown,
    #[serde(rename = "tir lim bom bom")]
    Var1,
    #[serde(rename = "hgga;hghau")]
    Var2,
    #[serde(rename = "hgueoqtyhit4t")]
    Var3,
}

当我测量以下内容时，所得的派生代码不会分配内存，并且在快速微基准测试中，与您的代码相比，大约快2倍：

serde_json::from_str::<FooDocument>(r#"{"type":"hgga;hghau"}"#).unwrap()

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-27

我来说两句

0 条评论

登录后参与评论

上一篇：Python Anaconda Windows 10的XGBoost安装问题（2018年5月18日）

杰克逊自定义序列化和反序列化

自定义枚举也是可序列化的吗？

使用Jackson自定义JSON反序列化

GSON：自定义对象反序列化

java-在自定义反序列化中调用标准反序列化

使用杰克逊可自定义序列化和反序列化

Spring Kafka自定义反序列化器

如何使用Serde使用自定义函数反序列化可选字段？

Jackson对多态对象的自定义反序列化

反序列化到自定义列表

使用Jackson自定义反序列化列表

自定义反序列化

使用Serde对数组或值数组进行自定义反序列化

自定义CSV反序列化

使用自定义IXmlSerializer反序列化注释

Android GSON自定义反序列化

对Java中的自定义枚举值反序列化json响应

枚举类型的自定义Serde序列化

使用GSON自定义反序列化枚举

使用Jackson的自定义JSON序列化/反序列化

自定义JSON.net序列化和反序列化

反序列化：从自定义类获取数据

Django自定义反序列化

原始数组的自定义Gson反序列化

rustc序列化自定义枚举解码

WebSocketsSharp 自定义事件反序列化

无法使用 Kafka-Streams 反序列化自定义 Serde

Rust 自定义反序列化实现

Ktor自定义json对象反序列化

TOP 榜单

文章

serde：加速自定义枚举反序列化

serde：加速自定义枚举反序列化

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u