在Python的BeatifulSoup中刮取itemprop =“ name”

Artemio Katrek

names = soup.find_all('meta', itemprop='name')
prices = soup.find_all('span', class_='price product-price')

for price, name in zip(prices, names):
    modelName = name
    modelPrice = price.text
    csv_writer.writerow([modelName, modelPrice])
print('Parsing prices: DONE')
csv_file.close()

这段代码之后，我将其导出到csv文件中，并得到如下所示的内容：

    "
"<meta content=""TEXT HERE"" itemprop=""name"">
</meta>","
          PRICE HERE

我想摆脱导出的代码，我只需要一个名称和价格。网站代码如下：

<a itemprop="name" class="product-name listgrid" href="https://websitename.com" title="Name of needed model to parse</a>

Linas Fx

如果只需要文档或标签的文本部分，则可以使用该get_text()方法。它以单个Unicode字符串的形式返回文档中或标签下的所有文本。

在您的情况下，类似的方法应该起作用：

soup.find_all()[0].get_text()

我认为没有必要循环。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-30

我来说两句

0 条评论

登录后参与评论

在Python中BeautifulSoup抓取itemprop =“ name”

在python中清理刮取的网址

python name错误

在 python Beatifulsoup 中 Extrack JSON 数据

在Python lxml中刮取HTML表

在python中刮取JavaScript呈现的HTML页面

Python __set_name__中的异常行为

name 与 package 在 python 中

Python语法中'NAME'的定义是什么

Python的unicodedata.name的倒数？

<fragment>中的android：name属性

function_name()() 中的语法

为什么zsh允许$ {name：-word}中的name为null？

javascript中的window [“ name”]和window.name

user.name返回：name键-Rails App中的错误

设置“ this.name = name;”的目的是什么在JavaScript中？

从Oracle中的full_name提取first_name和last_name

可以将<meta>标记与itemprop =“ name”属性一起使用吗？

如何通过在python的所有输出中添加name1.name 2 ....来改变输出

在 CSS 中定位 itemprop

从下拉选项值中刮取Python BeautifulSoup

在python（lxml）中刮取嵌套的非结构化表

使用Python从div类中刮取并返回值

使用Python和bs4从图像中刮取“标题”

Python美丽的汤从图表中刮取确切的内容

使用Python刮取表格

使用“ getElementsByTagName”在Python中获取标签<string name =“ ID”>

如何在Python模块中定义name变量？

在Python中获取调用函数模块的name

TOP 榜单

文章

在Python的BeatifulSoup中刮取itemprop =“ name”

在Python的BeatifulSoup中刮取itemprop =“ name”

Linux的官方Adobe Flash存储库是否已过时？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

如何检查字符串输入的格式

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

Modbus Python施耐德PM5300

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

用日期数据透视表和日期顺序查询

检查嵌套列表中的长度是否相同

Java Eclipse中的错误13，如何解决？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

如何自动选择正确的键盘布局？-仅具有一个键盘布局

ES5的代理替代

在令牌内联程序集错误之前预期为 ')'

有什么解决方案可以将android设备用作Cast Receiver？

套接字无法检测到断开连接

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

应用发明者仅从列表中选择一个随机项一次

在Windows 7中无法删除文件（2）

ggplot：对齐多个分面图-所有大小不同的分面