如何在Python中将文件转换为utf-8?

塞巴斯蒂安·罗卡(SébastienRocca)

我需要在Python中将一堆文件转换为utf-8,并且在“转换文件”部分遇到麻烦。

我想做相当于:

iconv -t utf-8 $file > converted/$file # this is shell code

谢谢!

DzinX:

您可以使用codecs模块,如下所示:

import codecs
BLOCKSIZE = 1048576 # or some other, desired size in bytes
with codecs.open(sourceFileName, "r", "your-source-encoding") as sourceFile:
    with codecs.open(targetFileName, "w", "utf-8") as targetFile:
        while True:
            contents = sourceFile.read(BLOCKSIZE)
            if not contents:
                break
            targetFile.write(contents)

编辑:添加BLOCKSIZE参数以控制文件块大小。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何在Java中将HTML转换为UTF-8

如何在Python中将字符串转换为utf-8

如何在Python中将UTF-8代码转换为符号字符

如何在python中将原始unicode转换为utf8-unicode?

如何在Python中将文本文件(包含非英语语言的文本)的编码从“ UTF-16 LE”转换为“ UTF-8”?

如何在EXR文件的Python中将float16转换为uint8

如何在 Java 中将 ASCII 值转换为 UTF-8 字符串?9812 -> ♔

如何在Oracle查询中将CLOB转换为UTF8?

Android-如何在Android中将字符串转换为utf-8

如何在Android中将字符串转换为UTF-8?

如何在Java中将UTF-8转换为US-Ascii

如何在Dart中将字符串转换为utf8?

如何在 Oracle 中将 CLOB 转换为 UTF8 BLOB

如何在混合编码目录中将GBK转换为UTF-8?

如何在Kotlin中将win1251编码转换为UTF8?

如何在PHP中将变量(文本/字符串)转换为utf8mb4

如何在php中将字符串转换为utf-8代码点

如何在C#中将字符串(ASCII类型)转换为UTF-8

如何在Java中将字节CP-1252转换为字节UTF-8

如何在 VIM 中将 Windows 控制台输出转换为 utf8

如何在 Julia 中将 utf8 代码转换为字符?

在Python中将CSV转换为UTF-8

在Python中将TeX口音转换为UTF-8

在python中将unicode字符转换为utf-8

像Python 2一样,如何在Python 3中将chr(0xdfff)转换为utf-8字节?

如何在 python 中将包含超出范围 utf-8 或 16 的字符的 unicode 字符串转换为二进制或十六进制?

java:如何将文件转换为utf8

如何在Go中从编码转换为UTF-8?

如何在PHP中将UTF-8字符串转换为HEX代码点?