在循环结束时向熊猫数据框添加行

亚当·瑟威尔

我试图在数据框中添加行作为循环的一部分。

该程序循环访问URL并以数据帧格式提取数据

for id in game_ids:
    df_team_final = []
    df_player_final = []
    url = 'https://www.fibalivestats.com/data/' + id + '/data.json'
    content = requests.get(url)
    data = json.loads(content.content)

在循环的最后，我用concat合并了客队/主队（和球员）的两个df

    team_full = pd.concat([df_home_team, df_away_team])
    player_full = pd.concat([df_home_player_merge, df_away_player_merge])

然后，在循环之外，我已编程为另存为Excel

# #if cant find it, create new spread sheet
writer = pd.ExcelWriter('Box Data.xlsx', engine='openpyxl')
team_full.to_excel(writer, sheet_name='Team Stats', index=False)
player_full.to_excel(writer, sheet_name='Player Stats', index=False)
writer.save()
writer.close()

当我循环浏览多个网页时，我需要随时更新df，显然在当前格式下，我只是用第二个循环覆盖了第一个网址

在循环结束时追加或添加到数据框的最佳方法是什么？

谢谢

政治科学家

由于我们看不到完整的代码，因此我只能在这里给出一个简单的轮廓。

我假设您没有将已抓取的数据附加到某种容器中，因此在下一次迭代后它会丢失。

# empty lists outside of loop to store data
df_team_final = []
df_player_final = []

for id in game_ids:
    url = 'https://www.fibalivestats.com/data/' + id + '/data.json'
    content = requests.get(url)
    data = json.loads(content.content)

    # create dataframes that you need
    # df_home_team, df_away_team etc
    # and append data to containers

    team_full = pd.concat([df_home_team, df_away_team])
    player_full = pd.concat([df_home_player_merge, df_away_player_merge])

    df_team_final.append(team_full)
    df_player_final.append(player_full )

现在，您将数据框存储为列表，可以将它们与合并 pandas.concat

# outside of the loop
team_full = pd.concat(df_team_final)
player_full = pd.concat(df_player_final)

并立即保存：

writer = pd.ExcelWriter('Box Data.xlsx', engine='openpyxl')
team_full.to_excel(writer, sheet_name='Team Stats', index=False)
player_full.to_excel(writer, sheet_name='Player Stats', index=False)
writer.save()
writer.close()

编辑

从共享的文件中，我看到您在循环内添加了容器：

但是您应该将它们放在循环开始之前：

# initialize them here
df_team_final = []
df_player_final = []
for id in game_ids:

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-25

我来说两句

0 条评论

登录后参与评论

上一篇：在AWS S3中使用AWS开发工具包（NodeJS）创建一个空文件夹

在熊猫中向数据框添加行

向数据框熊猫添加行

向数据框添加行

在循环结束时添加暂停

在熊猫数据框中添加行移位

根据列值向熊猫数据框添加行并增加日期时间值？

向现有熊猫数据框添加行的最快方法

Php/Jquery 在循环数据时添加行

熊猫-从字典列表创建数据框时如何添加行作为列？

在循环结束时合并数据帧以进行网页抓取

向数据框添加行以进行非观察

使用插值向 Pandas 数据框添加行

向数据框添加行以统一组的长度

如何根据条件向数据框添加行

熊猫数据框基于键减少/添加行

Python-在熊猫数据框之间添加行

熊猫：在数据框的组中添加行

熊猫：当键是数据框的索引时，从字典中向数据框添加一列

熊猫向数据框列添加系列

向熊猫数据框添加数组

向熊猫数据框添加多列

通过 for 循环向数据框添加列

从 For 循环结果向数据框添加值

向熊猫添加行以完成序列

直到循环结束时退出1

每次最后结束时就开始循环

JS循环结束时的jQuery hide（）

循环结束时推迟解决

jQuery在Ajax结束时继续循环

TOP 榜单

文章

在循环结束时向熊猫数据框添加行

在循环结束时向熊猫数据框添加行

编辑

IE 11中的FormData未定义

如何一次从多个文本框中获取值？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

OpenCv：改变 putText() 的位置

Redux动作正常，但减速器无效

如何从JavaScript中的MP3文件读取元数据属性？

如何使用Redux-Toolkit重置Redux Store

将加号/减号添加到jQuery菜单

OpenGL纹理格式的颜色错误

获取并汇总所有关联的数据

超过时间限制错误C ++

ActiveModelSerializer仅显示关联的ID

在交互式Python Shell中获得最后结果

如何开始为Ubuntu开发

去噪自动编码器和常规自动编码器有什么区别？

Excel 2016图表将增长与4个参数进行比较

算术中的c ++常量类型转换

使用因子时如何在y轴上的ggplot中插入count或％

TreeMap中的自定义排序

如何在R中转置数据

在 React Native Expo 中使用 react-redux 更改另一个键的值