从 html 中清除数据

Panri93 发表于 Dev

19

盘里93

我正在尝试清理我通过网络抓取提取的部分数据。包含数据的 HTML 代码如下：

<li class="price-was">
    $1,699.00
    <span class="price-was-data" style="display: none">1699.00</span>
</li>

要提取数据，我使用以下代码行：

price_products_before = product.findAll("li",{"class":"price-was"})
PriceBefore = price_products_before[0].text

我使用这个是因为数据是这样的：

'\r\n       $1,699.00\r\n            1699.00\n'

使用下面的代码行，我设法以某种方式清理了它，但我仍然有两倍的数字。

PriceBefore = price_products_before[0].text.strip().replace("\r\n","")

我只需要一次 1699 没有任何空格 \r 或 \n。

αԋɱҽԃ αμєяιcαη

from bs4 import BeautifulSoup

html = """<li class="price-was">
    $1,699.00
    <span class="price-was-data" style="display: none">1699.00</span>
</li>"""

soup = BeautifulSoup(html, 'html.parser')

try:
    print(soup.find("li", class_="price-was").next_element.strip())
except:
    print("Not Found")

输出：

$1,699.00

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-5

我来说两句

0 条评论

登录后参与评论

上一篇：使用python中的关键字列表进行Google搜索网络抓取

相关文章

如何清除数据库代码

删除数据库表中的特定行并生成html表

关闭时从Bootstrap模态中清除数据属性值

允许在不清除先前数据的情况下将文本拖放到html输入字段中

如何从C ++结构化数组中清除数据？

离子清除数据

在熊猫中管理数据清除数据的最佳方法

如何删除数据库中的HTML标签？

在AWS Neptune中清除数据

在C中清除数组

从网页退出时清除数据库中的表

在React受控组件中清除数据列表输入onClick

Python根据重复值从HTML文件中删除数据

具有电子邮件表单的HTML和PHP静态网站并清除数据

Sencha touch列出清除数据

如何清除模型中的数据并包含HTML？

Django不清除数据

服务停止从设置中清除数据

JavaFX AreaChart清除数据

从fitnesse表中清除HTML

如何从html表格php mysql中删除数据

使用while循环清除数据。

UITableviewCell无法清除数据？

使用dplyr清除数据

从块中的Redis缓存清除数据

单击时清除数据属性

从 HTML 中清除/去除 Javascript

Dockerfile VOLUME 指令清除数据

清除 jQuery 中的 html 空格

TOP 榜单

文章

热门标签

归档