我有要转换为Unix格式的文件。选择python转换方式可能遇到的差异/问题是什么:
import sys
filename = sys.argv[1]
text = open(filename, 'rb').read().replace('\r\n', '\n')
open(filename, 'wb').write(text)
而不是:在子进程中调用dos2unix Unix命令?
谢谢 !
来自man dos2unix
:
Dos2unix软件包包括实用程序“ dos2unix”和“ unix2dos”,可将DOS或Mac格式的纯文本文件转换为Unix格式,反之亦然。
在DOS / Windows文本文件中,换行符(也称为换行符)是两个字符的组合:回车符(CR)和换行符(LF)。在Unix文本文件中,换行符是单个字符:换行符(LF)。在Mac OS X之前的Mac文本文件中,换行符是单个回车(CR)字符。如今,Mac OS使用Unix样式(LF)换行符。
除了换行符外,Dos2unix还可以转换文件的编码。可以将一些DOS代码页转换为Unix Latin-1。Windows Unicode(UTF-16)文件可以转换为Unix Unicode(UTF-8)文件。
...
-ascii仅转换换行符。这是默认的转换模式。
dos2unix
因此,除了转换换行符外,还可以做更多的事情,但是默认行为仅仅是这样。
如果文件编码错误,则也必须对其进行处理dos2unix
。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句