使用BeautifulSoup刮除没有唯一标识符的元素

D.拉德

之前,我在Python中进行过少量的Web抓取工作,但是我一直陷在一个相当简单的问题上。

我想从本页的表格中查询价格

我可以获得诸如单个元素或所有比率之类的东西(因为它们都列在“ fccu__slash”类下,但是我不知道如何以可用格式逐行获取结果。

这是我的代码的相关部分:

FCCU_url = "https://www.fccu.org/Rates/CD-Rates"
FCCU_resp = requests.get(FCCU_url, timeout=3)
FCCU_soup = BeautifulSoup(FCCU_resp.content, "html.parser")
for elem in FCCU_soup.find_all("td"):
    try:
        print(elem.contents[0])
    except IndexError:
        print(elem.contents)

这将输出我想要的所有信息,但不是可用的格式。

理想情况下,我只希望以我感兴趣的术语刮擦CD,并以这种格式输出结果(我只关心利率而不是APY):

['3 Month', '0.65%', '0.75%']
['6 Month', '1.44%', '1.59%']
['2 Year', '2.37%', '2.62%']

这些不是我关心的特定问题,但是一旦我了解了如何做,便想自行进行调整。

感谢您的任何提前帮助。

安德森

尝试下面的代码以获取所需的输出:

FCCU_url = "https://www.fccu.org/Rates/CD-Rates"
FCCU_resp = requests.get(FCCU_url, timeout=3)
FCCU_soup = BeautifulSoup(FCCU_resp.content, "html.parser")
for elem in FCCU_soup.select("tbody tr"):
    cells = [td for td in elem.findChildren('td')]
    data = [cells[0].text, cells[2].span.text, cells[3].span.text]
    print(data)

输出:

['3 Month', '0.65%', '0.75%']
['6 Month', '1.44%', '1.59%']
['1 Year', '2.13%', '2.37%']
['2 Year', '2.37%', '2.62%']
['3 Year', '2.27%', '2.52%']
['4 Year', '2.37%', '2.62%']
['5 Year', '2.96%', '3.20%']
['9 Month', '0.95%', '1.09%']
['19 Month', '1.98%', '2.08%']
['2 Year²', '2.27%', '2.52%']
['4 Year³', '2.32%', '2.57%']
['2 Year', '2.27%', 'N/A']

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Selenium (c#) - html 元素中没有唯一标识符 - javascript?

如何在硒中没有唯一标识符的元素中定位?

没有唯一标识符的自举崩溃

没有唯一标识符的内连接

使用VBA在Access表中查找值而没有唯一标识符的情况

在没有唯一标识符的项目上使用“ListAdapter” areItemsTheSame

使用 Selenium 选择没有唯一标识符或事件的按钮

当这些缺少唯一标识符时,选择同一列中除一个之外的所有 td 元素

有没有办法在MPI中获得唯一的通信器标识符?

用唯一标识符替换数组中的元素

如何删除没有唯一标识符的重复行

Python Pandas:标记没有唯一标识符的记录

没有连接到iOS和Android的蓝牙设备是否存在唯一标识符?

合并没有唯一标识符的行

Angular 2 没有为选择箭头 div 生成唯一的组件标识符

如何在没有唯一标识符的情况下抓取跨度?

BeautifulSoup 4,查找没有标识符的文本

没有html元素没有标识符时如何使用watir迭代表

Python中是否有对象唯一标识符

iOS中的私有唯一设备标识符

带有专用API的iBeacon唯一标识符

频道是否有唯一标识符

使用javascript创建唯一的对象标识符

使用 Fluent API 添加唯一标识符

在 Django 日志中使用唯一的用户标识符

使用某些唯一标识符识别Microsoft Band

使用purrr进行下采样。唯一标识符

performSegueWithIdentifier没有标识符标识

如何使用没有标识符的 WebDriver.io 在页面上查找元素