熊猫统计表

罚球

我在一个表/ csv中堆积了一堆统计外贸数据:
年份,is_export(否则为进口),国家/地区,海关代码,宏代码(一组海关代码)和价值(以美元为单位)。

我希望能够使用pandas来对数据进行分组(而不是使用普通的sql),并获得如下信息:

macro_group=12

2012  2013 2014
country
export

我是否只需要进行几次groupby调用(在要建立层次结构的“键”上)?

编辑:所有行都是相同的:

id|Country|Year|Export|Macro|Code|Codename|Value
1|China|2012|1|69|6996700|Articles,of iron or steel wire,n.e.s.|0.0
2|Germany|2012|1|69|6996700|Articles,of iron or steel wire,n.e.s.|59.9
3|Italy|2012|1|69|6996700|Articles,of iron or steel wire,n.e.s.|33.2

我想得到的是:

**Macro e.g. 23**
China total export
2012 2013 2014
432  34  3243

China total import
2012 2013 2014
4534 345  4354

Russia total import...

等等

马特

尚不清楚您的预期输出是什么(鉴于您提供的数据)。我想您希望获得每个国家/地区和年份的总价值(如果没有,请随时纠正我):

import pandas as pd

########### Setup some test data: #############
s = """id|Country|Year|Export|Macro|Code|Codename|Value
1|China|2012|1|69|6996700|Articles,of iron or steel wire,n.e.s.|0.0
2|Germany|2012|1|69|6996700|Articles,of iron or steel wire,n.e.s.|59.9
3|Germany|2013|1|69|6996700|Articles,of iron or steel wire,n.e.s.|80.0
4|Germany|2013|1|69|6996700|Articles,of iron or steel wire,n.e.s.|40.0
5|Italy|2012|1|69|6996700|Articles,of iron or steel wire,n.e.s.|33.2"""

from StringIO import StringIO
df = pd.read_csv(StringIO(s), sep='|')

pd.Series.__unicode__ = pd.Series.to_string # suppress meta-data when printing

########### The real stuff happens here: #############
macro = 69
group_by = df[df.Macro == macro].groupby(['Country', 'Year'])['Value'].sum()

for country in df.Country.unique():   
    print '---', country, '---'
    print group_by[country]
    print

结果为以下输出:

--- China ---
2012    0

--- Germany ---
2012     59.9
2013    120.0

--- Italy ---
2012    33.2

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

显示几个汇总统计表

如何制作汇总统计表

JMeter统计表中的KO是什么意思?

统计表中的记录并显示特定值的行号

连续变量双向汇总统计表

自定义描述性统计表导出

使用dplyr的描述性统计表中的长格式

生成R中大量特定变量的人口统计表/频率

循环以使用聚合来计算描述性统计表

统计表中的事件并以rmarkdown和可伸缩性显示

在汇总统计表中添加一行sum

作业完成后将作业信息插入到统计表中 DataStage

Python,BeautifulSoup从统计表中抓取特定或确切的数字

在 R 中的 ggplot、geom_bar 图表底部添加统计表

将两个统计表的结果合并到R中的一个表中

显示 datasummary 中唯一值的计数,并使用数据组合两个不同的描述性统计表

Dplyr:为多个变量生成摘要描述性统计表(标准误差和变异系数)

summary.manova输出显示与summary.manova统计表和扫帚tidy()不同的p值

使用Tidyverse为每个用户/参与者输出一系列汇总统计表

如何生成带有所有相关小数位的摘要统计表以出现在R的结果表中?

如何将男性和女性的总和相加,以将性别作为人口统计表中的变量删除。在R Studio中

R中有没有一种方法可以从数据列表中创建汇总统计表

筛选,分组并统计熊猫?

熊猫DataFrame统计跟踪

Python熊猫统计

如何在此熊猫表上计算“滚动”统计信息,但时间窗口以数据点为中心?

熊猫模糊组摘要统计

gnuplot 频率表统计信息

使用熊猫计算头对头统计