我已经编写了Python代码,以便从网站抓取某些年。为此,我创建了一个for循环来迭代这些年,并使用该字符串导航到该网站。见下文:
from selenium import webdriver
from bs4 import BeautifulSoup
from urllib.parse import urljoin
import pandas as pd
URL = 'url'
for year in range(2012,2021):
type(year)
stryear = str(year)
driver.get(URL + stryear)
content = driver.page_source
soup = BeautifulSoup(content,features="lxml")
#Rest of code
由于某种原因,第一次迭代就可以了。运行调试模式时,我看到在第二次迭代中,变量year是一个值为2013的整数(符合预期)。但是,变量stryear的类型为{Resultset:0} [],来源为{SoupStrainer} 2013 | {}。
显然,我没有在代码的其他任何地方声明stryear。我需要stryear是包含年份的字符串。为什么可变stryear的行为不符合我的预期?
检查您的进口。很可能str()
是从Soup库本地导入的,或者是从monkey patched
全球获取的。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句