http://www.indymini.com/p/mini-marathon/miniresults
我想使用 python BS4 废弃此 url 上可用的表,但是当我更改表大小或更改页面时,url 不会更改。
在表格中导航时,URL 不会改变,因为表格似乎是使用 javascript(特别是 DataTables 库)实现的 - 并使用 AJAX 来获取要显示的相关数据。
所以,基本上,我没有看到一种方法可以在页面加载时使用 BS4 抓取页面并获取默认显示的数据以外的数据。
另一方面,由于使用 AJAX 检索数据,您可以尝试找出 AJAX 请求的格式(什么参数对您想要的结果执行什么操作,例如使用 Firebug)并直接在 JSON 中检索数据通过调用提供数据表的 AJAX URL 来格式化。
但是,根据您对数据的预期用途,您可能需要考虑向网站所有者请求下载和使用数据的许可。而且,谁知道呢——他们可能愿意帮忙。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句