我正在尝试使用python脚本在循环中编辑.html文件的大目录。我在使用os.walk()遍历文件名时遇到麻烦。这段代码只是将html文件转换为我可以使用的字符串,但是脚本甚至没有进入循环,就好像文件不存在一样。基本上,它可以打印,point1
但是永远不会到达point2
。脚本结束,没有错误消息。该目录设置在名为“ amazon”的文件夹中,并且其中包含20个子文件夹的一级,每个文件夹中都有20个html文件。
奇怪的是,该代码可以在仅包含.txt文件的相邻目录上完美运行,但是由于某种原因,它似乎没有抓住我的.html文件。关于for root, dirs, filenames in os.walk()
循环的结构,我是否不了解?这是我第一次使用os.walk,并且我查看了此站点上的许多其他页面以尝试使其工作。
import os
rootdir = 'C:\filepath\amazon'
print "point1"
for root, dirs, filenames in os.walk(rootdir):
print "point2"
for file in filenames:
with open (os.path.join(root, file), 'r') as myfile:
g = myfile.read()
print g
任何帮助深表感谢。
反斜杠用作转义符。可以将它们加倍,也可以在其上加上前缀“ r”来使用“原始字符串”。
例子:
>>> 'C:\filepath\amazon'
'C:\x0cilepath\x07mazon'
>>> r'\x'
'\\x'
>>> '\x'
ValueError: invalid \x escape
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句