如何在熊猫中使用API端点下载.csv文件

博格丹

我想从带有熊猫的API端点下载csv文件。我正在使用以下代码:

df=pd.read_csv('https://data.cityofnewyork.us/resource/nu7n-tubp.csv').

但是,即使数据集更大(约121k行),结果数据框也只有1,000行。如何下载所有行?

我尝试指定一个大于1,000的数字,但得到的结果相同。

小汤姆·申克

Socrata通常要求您翻阅设置为1,000行的数据。您可以通过使用$limit参数增加它来对其进行修改根据数据集页面,这大约是122k行,因此可以使用限制为130k来全部获取它们:

df=pd.read_csv('https://data.cityofnewyork.us/resource/nu7n-tubp.csv?$limit=130000')

您可能还想探索SodaPy库。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章