我有一个如下所示的矩阵,我需要从COL01-04列和该列的名称(不包括NaN)中再创建两个最小值最小的列:
In[1]: matrix
Out[1]:
ID COL01 COL02 COL03 COL04
0 0001 NaN 1662 1583 1697.4
1 0002 NaN 1006 1476 1018.44
2 0003 1452 1487 2197.5 1516.27
3 0004 NaN 1554 2298 1585.62
像这样:
ID COL01 COL02 COL03 COL04 Min_val Min_col
0 0001 NaN 1662 1583 1697.4 1583 COL03
1 0002 NaN 1006 1476 1018.44 1006 COL02
2 0003 1452 1487 2197.5 1516.27 1452 COL01
3 0004 NaN 1554 2298 1585.62 1554 COL02
我已经尝试过了
for i in range(0, len(matrix)):
matrix['Min_val'] = matrix[['COL01', 'COL02', 'COL03', 'COL04']].min()
但是结果NaN
无处不在,请键入numpy.float64
。
使用DataFrame.min
并DataFrame.idxmin
与axis=1
每行的校验值:
c = ['COL01', 'COL02', 'COL03', 'COL04']
matrix[c] = matrix[c].apply(lambda x: pd.to_numeric(x, errors='coerce'))
matrix['Min_val'] = matrix[c].min(axis=1)
matrix['Min_col'] = matrix[c].idxmin(axis=1)
或对于新列使用DataFrame.assign
:
matrix = matrix.assign(Min_val = matrix[c].min(axis=1), Min_col=matrix[c].idxmin(axis=1))
print (matrix)
ID COL01 COL02 COL03 COL04 Min_val Min_col
0 1 NaN 1662 1583.0 1697.40 1583.0 COL03
1 2 NaN 1006 1476.0 1018.44 1006.0 COL02
2 3 1452.0 1487 2197.5 1516.27 1452.0 COL01
3 4 NaN 1554 2298.0 1585.62 1554.0 COL02
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句