无法使用 Google Sheet 中的 IMPORTHTML 或 IMPORTXML 从网站抓取数据

魏泽

在此处输入图片说明

我想使用 Google Sheet 从网站上抓取数据,如上面的屏幕截图(红色框中的数据)所示。我尝试使用IMPORTHTMLIMPORTXML但两者都不起作用(输出为空)。

这是我的谷歌表:

https://docs.google.com/spreadsheets/d/1ELo3iA4RmhUuFq7YEfsCVt2iuURFxc1Crdng7rLovTo/edit#gid=0

我不确定是否可以https://stockrow.com/AAPL使用IMPORTHTML或 来从该网站 ( ) 中抓取数据IMPORTXML或者是否可以使用 Google Apps Script 来实现?

纳粹党

对于这些类型的网站,由于内容是动态生成的,就像已经提到的评论一样,因此 Sheets 和 Apps Script 不可能抓取它们。

当有人在这些类型的网站上进行抓取时,他们中的大多数确实在 Python 中使用 Selenium。基本上,它所做的是执行浏览器自动化。

我知道这对您来说可能是无用的信息,因为 Google App Engine 不是标签,但是对于可能会遇到此问题并且非常熟悉 Python 中的 Selenium 的其他所有人,这可能会有所帮助。

在 Google App Engine 中运行 Selenium 可能是一个解决方案,但如果您不想花时间与 Google App Engine 一起学习和理解 Python,我建议您避免这样做。底部列出了可以说明问题的参考资料。

选择:

  • 在不投入太多时间的情况下解决该问题的最佳方法是找到一个替代站点,该站点的内容不是由 JavaScript 生成的,并且确实为您提供了相同的数据。
  • 检查站点是否是 JS 生成的一种方法是检查页面源。如果您抓取的是源代码,则该文本不是 JavaScript 生成的。

参考:

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用VBA从网站中抓取数据

在Google Apps脚本中触发importHTML

Google表格中的importxml xpath

VBA网站抓取。无法访问表中的数据

使用Google表格进行网页抓取。Importxml函数xpath校正

Google表格中的IMPORTXML函数

importxml从表中抓取值

可以在Google表格中限制importhtml吗?

IMPORTHTML或IMPORTXML从站点收集数据

用大括号加入importxml和importhtml

Google表格:使用ImportXML从网站导入数字

无法使用Google表格中的IMPORTXML检索xml数据

使用Google表格IMPORTXML功能刮擦网站

使用Google表格上的URL选项卡的ImportXML / ImportHTML解决方法

使用组合框VBA中的选项来抓取网站数据

输出与IMPORTXML和IMPORTHTML混淆

使用 ImportHTML 或 ImportXML 在 Google 表格中选择不连续的列、删除行和添加排序列

如何使用 Selenium 从动态网站中抓取数据

使用 Google 表格中的复选框刷新 importHTML 的脚本

使用 ImportXml 在 Google 表格中抓取图像

具有特定 div 编号的 Google Sheet IMPORTXML div 类(类中的类)

Google Sheet importxml tr td

从网站抓取数据时 IMPORTXML 显示错误

Google Sheets IMPORTHTML“无法获取数据”

使用 Google Sheet 中的数据创建多项选择题

从 Google 表格中的 IMPORTXML 返回的数据不正确

我无法使用 xpath 和 IMPORTXML 访问网站中的数据,因为代码片段在源数据之外

google sheet importhtml 点击显示更多

创建 UrlFetchApp 脚本以替换 Google Sheet importHTML 函数