Ruby中的csv文件编码问题

用户名

我使用ruby解析csv文件并收到错误

invalid byte sequence in utf-8 csv

我尝试了编码选项

    CSV.foreach(path, {headers: true, encoding: 'windows-1251:utf-8'}) do |row|
        new_row = {}
        headers = []
        row.each do |k,v|
            headers << k
            v = v.force_encoding('UTF-8') || ''
            v.gsub! "\xE2\x80\x96", "-"
            v.gsub! "\xE2\x80\x93", "-"
            v.gsub! "\xE2\x80\x94", "-"
            v.gsub! "\xE2\x80\x95", "-"
            v.gsub! "\xE2\x80\x98", "'"
            v.gsub! "\xE2\x80\x99", "'"
            v.gsub! "\xE2\x80\x9C", "\""
            v.gsub! "\xE2\x80\x9D", "\""
            v.gsub! "\xE2\x80\xA6", "..."
            v.gsub! "\x0D\x0A", "\n"
            v.gsub! "\xC2\xA0", " "
            v.gsub! "\xC2\xB0", " "

            new_row[k] = v
        end

        output_csv.puts headers if output_csv.header_row?
        output_csv.puts new_row
    end

现在我结束了

incompatible encoding regexp match (ASCII-8BIT regexp with UTF-8 string)

在CSV文件中引起此问题的字符串是“ G.ran”

下面是示例输入行

David Evans & Assocs    www.deainc.com  13858534    [email protected]  G�ran   Volk    5034990383

谁能建议我如何解决这个问题。

阿列克谢·马蒂什金（Alexei Matiushkin）

该问题很可能是由于以错误的编码保存文件引起的。假设您的文件中有Unicode符号“★”。将其另存为ASCII或Latin1其他每符号1个字节的编码，则会丢失一些数据。

符号“ ...”被称为替换字符。它用来表示“这里是在编码转换过程中显然丢失的unicode。”

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-27

我来说两句

0 条评论

登录后参与评论

导出CSV文件的编码问题

Windows中的Ruby编码问题

在C＃中读取CSV文件时出现编码字符串问题

编码 .csv 文件内容转换为 .json 文件的问题

在源文件中声明编码问题

文件夹路径中的编码问题

在Python中读取文件时的编码问题

Ruby编码问题

Python中CSV文件的错误编码

Excel CSV编码问题

Excel的CSV文件上的UTF- /编码问题

使用python读取CSV文件时的编码问题

JSON编码问题Ruby 2.0.0

用Sublime Text编码-在CSS中遇到文件路径问题

Python3 Linux中的文件名编码问题

非英语语言环境中的文件损坏（编码问题？）

从node.js中的URL读取XML文件：编码问题

C＃中的西班牙文文件编码问题

重定向输出到文件给C中的编码问题

从文件中读取文本时出现编码问题

JExcel中的编码问题

python中的编码问题

如何在Ruby中声明CSV文件

Ruby中的CSV文件重复存档器

在python中读取德语csv文件的问题

Excel中的csv文件格式问题

Django中CSV文件附件路径问题

从CSV文件中读取并解决“;”问题

TOP 榜单

文章

Ruby中的csv文件编码问题

Ruby中的csv文件编码问题

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID