如何使用Python Selenium获取部分html源代码？

威廉

当我使用driver.page_source时，我将获得完整的源代码页面，有什么方法可以获取html代码的特定部分。

from selenium import webdriver
chrome_options = webdriver.ChromeOptions ()

from selenium.webdriver.common.keys import Keys
    
    driver = webdriver.Chrome (executable_path="/selenium/chromedriver", options=chrome_options)
    driver.get("https://news.creaders.net/us/2021/01/27/2315313.html")
            
    content = driver.page_source

然后，我将收到整页的html。

但是我只需要在里面的html： <div id="newsContent"> </div>

<div id="newsContent">

<p></p><p>cotent</p><p style="text-align: center;"><img src="https://pub.creaders.net/upload_files/image/202101/20210127_16117914118079.png" title="20210127_16117914118079.png" alt="image.png"></p>

</div>

邮电

尝试通过BeautifulSoup解析器运行HTML输出。

from bs4 import BeautifulSoup

soup = BeautifulSoup(html)
div = soup.find('div', id='newsContent')
print ''.join(map(str, div.contents))

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-02-1

我来说两句

0 条评论

登录后参与评论

使用 selenium 获取完整的 html 源代码

无法获取Zomato网站的HTML源代码Selenium、Python

如何使用JavaScript获取HTML源代码？

使用Shell脚本大量获取HTML源代码的一部分

导航 Python Selenium 后如何获取新的页面源代码

如何使用 selenium / webdriver 从网页中获取整个源代码？

如何获取网页的html源代码

如何通过获取HTML页面源代码

selenium：单击按钮后如何获取页面源代码

使用 selenium 发出请求时是否可以获取源代码？

网页抓取时如何获取 HTML 代码而不是源代码？

抓取时html源代码中的隐藏部分（python）

Python：如何使用Selenium打印所有源代码

ChromiumFX-如何同步获取HTML源代码？

如何在 Android 中获取 URL 的 HTML 源代码？

如何通过JavaScript获取静态的原始HTML源代码？

C＃Windows App如何从WebView获取html源代码

在 python 中使用 selenium 抓取 HTML 代码部分（不是文本）

如何使用Selenium在页面源代码中找不到HTML元素？

如何获取命令的源代码？

如何从Selenium IDE生成Java源代码（IDE代码在HTML扩展中）

在python中使用Selenium获取特定div的HTML代码

如何使用fetch在Firefox或chrome网页扩展程序中获取网页的HTML源代码？

使用Python中的BeautifulSoup在HTML源代码中获取JS var值

如何获取仅在使用 python selenium 悬停时出现的元素的 html 代码

如何下载 HTML 的源代码

我正在尝试使用 Selenium 获取页面源代码，但我得到了空页面

如何使用 selenium 和 python 在`::before` 部分获取文本？

javascript对html进行更改后如何获取html源代码（没有浏览器）

TOP 榜单

文章

如何使用Python Selenium获取部分html源代码？

如何使用Python Selenium获取部分html源代码？

隐藏发件人没有短信PHP

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在浏览器中请求URL时会发生什么？

flask-admin 如何自定义删除按钮

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

用日期数据透视表和日期顺序查询

Jqgrid：多级别组摘要

java io ioexception无法解析服务器地址解析器的响应

Swift如何使用Base64Url编码JWT标头和有效负载之类的json对象

sshd AllowGroups组未授予访问权限

jQuery无限滚动固定div中的滚动

android 背部按下

Flexbox CSS 对齐属性环境惰性？

为什么随机森林中的平均降低基尼系数取决于人口规模？

ClickHouse 创建临时表

为什么PlusShare.Builder setRecipients方法不起作用？

如何在Android中识别MICR代码

PyQt4.QtCore模块无法向sip模块注册

正则表达式，用于查找所有以任何字母开头和数字开头的文件

是否可以通过编程方式对很多动画进行重新着色？

机器密钥生成