将可变长度数组从csv解析为struct

user3939059:

我有以下设置来解析csv文件:

package main

import (
    "fmt"
    "os"
    "encoding/csv"
)

type CsvLine struct {
    Id string
    Array1 [] string
    Array2 [] string
}


func ReadCsv(filename string) ([][]string, error) {

    f, err := os.Open(filename)
    if err != nil {
        return [][]string{}, err
    }
    defer f.Close()

    lines, err := csv.NewReader(f).ReadAll()
    if err != nil {
        return [][]string{}, err
    }
    return lines, nil
}


func main() {

    lines, err := ReadCsv("./data/sample-0.3.csv")
    if err != nil {
        panic(err)
    }

    for _, line := range lines {
                fmt.Println(line)
        data := CsvLine{
            Id: line[0],
            Array1: line[1],
            Array2: line[2],
        }
        fmt.Println(data.Id)
        fmt.Println(data.Array1)
        fmt.Println(data.Array2)
    }
}

并在我的csv文件中进行以下设置:

594385903dss,"['fhjdsk', 'dfjdskl', 'fkdsjgooiertio']","['jflkdsjfl', 'fkjdlsfjdslkfjldks']"
87764385903dss,"['cxxc', 'wqeewr', 'opi', 'iy', 'qw']","['cvbvc', 'gf', 'mnb', 'ewr']"

我的理解是可变长度列表应解析为切片,是否可以直接通过csv阅读器执行此操作?(csv输出是通过python项目生成的。)

帮助/建议表示赞赏。

icza:

CSV没有“可变长度数组”的概念,它只是一个用逗号分隔的值列表。该格式在RFC 4180中进行了描述,而这正是该encoding/csv包所实现的。

您只能从CSV行中获取字符串切片。如何解释这些值取决于您。如果要进一步拆分数据,则必须对数据进行后期处理。

您所拥有的可以通过regexp包装简单地处理,例如

var r = regexp.MustCompile(`'[^']*'`)

func split(s string) []string {
    parts := r.FindAllString(s, -1)
    for i, part := range parts {
        parts[i] = part[1 : len(part)-1]
    }
    return parts
}

测试它:

s := `['one', 'two', 'three']`
fmt.Printf("%q\n", split(s))
s = `[]`
fmt.Printf("%q\n", split(s))
s = `['o,ne', 't,w,o', 't,,hree']`
fmt.Printf("%q\n", split(s))

输出(在Go Playground上尝试):

["one" "two" "three"]
[]
["o,ne" "t,w,o" "t,,hree"]

使用此split()功能,处理如下所示:

for _, line := range lines {
    data := CsvLine{
        Id:     line[0],
        Array1: split(line[1]),
        Array2: split(line[2]),
    }
    fmt.Printf("%+v\n", data)
}

输出(在Go Playground上尝试):

{Id:594385903dss Array1:[fhjdsk dfjdskl fkdsjgooiertio] Array2:[jflkdsjfl fkjdlsfjdslkfjldks]}
{Id:87764385903dss Array1:[cxxc wqeewr opi iy qw] Array2:[cvbvc gf mnb ewr]}

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章