Python pandas 為多個輸出變量生成一個表

Eng_GR

我有事故數據,其中部分數據包括事故發生的年份、受傷程度和受傷人員的年齡。這是 DataFrame 的一個示例:

df = pd.DataFrame({'Year': ['2010', '2010','2010','2010','2010','2011','2011','2011','2011'], 
                        'Degree_injury': ['no_injury', 'death', 'first_aid', 'minor_injury','disability','disability', 'disability', 'death','first_aid'],
                        'Age': [50,31,40,20,45,29,60,18,48]})

print(df)                   

在此處輸入圖片說明

當年齡小於 40 歲時,我希望將三個輸出變量按年份分組在表中,併計算殘疾人數、死亡人數和輕傷人數。

輸出應該是這樣的

在此處輸入圖片說明

當年齡小於 40 時,我生成了三個變量(num_disability、num_death、num_minor_injury),如下所示。

disability_filt = (df['Degree_injury'] =='disability') &\
                   (df['Age'] <40)
num_disability = df[disability_filt].groupby('Year')['Degree_injury'].count()
death_filt = (df['Degree_injury'] == 'death')& \
                    (df['Age'] <40)
num_death = df[death_filt].groupby('Year')['Degree_injury'].count()
minor_injury_filt = (df['Degree_injury'] == 'death') & \
                   (df['Age'] <40)
num_minor_injury = df[minor_injury_filt].groupby('Year')['Degree_injury'].count()

如何將這些變量組合在一張表中,如上表所示

先感謝您,

科拉連

pivot_table根據您的條件過濾行後使用

out = df[df['Age'].lt(40)].pivot_table(index='Year', columns='Degree_injury', 
                                       values='Age', aggfunc='count', fill_value=0)
print(out)

# Output:
Degree_injury  death  disability  minor_injury
Year                                          
2010               1           0             1
2011               1           1             0

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

python中的多個輸入

在兩個變量之間使用 += 操作時不斷出錯 - Python

如何在同一個輸出中一起顯示多個圖 -python

如何將多個變量分配給固定大小的“表”輸出

如何為 Pandas 數據框中的每個組生成一個 uuid

使用pandas在python中加載多個數據集

是否可以在 Python 中創建一個實例方法,將這樣的實例變量作為參數:var.method()?

如何將多個 csv 文件加載到 Python 中的可迭代變量?

如何為多個輸入分配一個整體變量?

KeyError: '一個或多個行標籤未找到' >> 查找 python pandas

你如何從python中的函數返回多個變量

類似字典的 Python 函數不會接受多個值作為輸入

在python中使用pandas創建多個輸出文件

Python根據另一個變量(熊貓)在數據框中生成虛擬對象

Python Pandas:僅從表中獲取 3 個第一個元素

如何將多個變量重構為一個帶參數的變量?

在python中使用os.getenv在一行上Delcare多個變量?

Terraform 使用輸出變量作為另一個資源的輸入

將包含多個 ID 號的 Python 變量傳遞到外部 BigQuery 腳本

循環處理多個數據幀並分別輸出pandas

在python中將多個變量作為一個變量傳遞

Python:pandas.errors.ParserError:標記數據時出錯。C 錯誤:第 21 行應為 1 個字段,看到 2 個

為多個變量創建一個條件 OR 的新變量

當變量賦值為矩陣時,Python 的一個非常簡單但奇怪的錯誤

Python 兩個變量 for 循環

python中具有多個變量的模擬退火

為什麼我的變量只在 Python 中的某個函數/語句中發生變化?

python:在多個變量中查找值

Python Pandas 多索引