我想从带有熊猫的API端点下载csv文件。我正在使用以下代码:
df=pd.read_csv('https://data.cityofnewyork.us/resource/nu7n-tubp.csv').
但是,即使数据集更大(约121k行),结果数据框也只有1,000行。如何下载所有行?
我尝试指定一个大于1,000的数字,但得到的结果相同。
Socrata通常要求您翻阅设置为1,000行的数据。您可以通过使用$limit参数增加它来对其进行修改。根据数据集页面,这大约是122k行,因此可以使用限制为130k来全部获取它们:
$limit
df=pd.read_csv('https://data.cityofnewyork.us/resource/nu7n-tubp.csv?$limit=130000')
您可能还想探索SodaPy库。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
点击生成二维码
我来说两句