我想使用 Google Sheet 从网站上抓取数据,如上面的屏幕截图(红色框中的数据)所示。我尝试使用IMPORTHTML
,IMPORTXML
但两者都不起作用(输出为空)。
这是我的谷歌表:
https://docs.google.com/spreadsheets/d/1ELo3iA4RmhUuFq7YEfsCVt2iuURFxc1Crdng7rLovTo/edit#gid=0
我不确定是否可以https://stockrow.com/AAPL
使用IMPORTHTML
或 来从该网站 ( ) 中抓取数据IMPORTXML
。或者是否可以使用 Google Apps Script 来实现?
对于这些类型的网站,由于内容是动态生成的,就像已经提到的评论一样,因此 Sheets 和 Apps Script 不可能抓取它们。
当有人在这些类型的网站上进行抓取时,他们中的大多数确实在 Python 中使用 Selenium。基本上,它所做的是执行浏览器自动化。
我知道这对您来说可能是无用的信息,因为 Google App Engine 不是标签,但是对于可能会遇到此问题并且非常熟悉 Python 中的 Selenium 的其他所有人,这可能会有所帮助。
在 Google App Engine 中运行 Selenium 可能是一个解决方案,但如果您不想花时间与 Google App Engine 一起学习和理解 Python,我建议您避免这样做。底部列出了可以说明问题的参考资料。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句