基于pandas中的多个条件对DataFrame进行排序

非线性

我有一个类似于以下的 DataFrame

date      mood    score   count  avg       abs
23/12/18 negative -50.893   137  -0.371     50.893
23/12/18 neutral  0.2193    10   0.0219     0.2193
23/12/18 positive 336.5098  673  0.5000     336.5098
24/12/18 positive 91.2414   232  -0.393     91.2414
24/12/18 neutral  0.063     14   0.0045     0.063
24/12/18 negative -649.697  1184 0.5487     649.697
25/12/18 negative -72.4142  8   -9.0517     72.4142
25/12/18 positive   0       0    0          0
25/12/18 neutral  323.0056  173 1.86708     323.0056
26/12/18 negative -12.0467   15 -.8031      12.0467

我想对这个数据集应用以下条件。

Con: if the absolute value(abs) score on a date is the greatest (of 3 moods), keep that date only together with its other attributes. 
Con: No duplicate date is to be kept. So the dataset will be reduced quite a lot compared to its original size.

预期产出

date       mood_corrected   score   count   avg          abs
23/12/18    positive      336.5098  673    0.50001456   336.5098
24/12/18    negative      649.697   1184   0.54873057   649.697
25/12/18    neutral       323.0056  173    1.86708439   323.0056
26/12/18    negative      -12.0467  15     -0.8031      12.0467

我的代码

import pandas as pd 

df =pd.read_csv('file.csv')

new_df= df.sort_values('abs', ascending=False).drop_duplicates(['date','mood'])

虽然我得到的结果是根据绝对值 **(abs)** 对数据集进行排序,但我仍然拥有完整的数据集。它没有减少。任何帮助表示赞赏。非常感谢。

注意:我查看了 stackoverflow,但没有发现非常相似的问题。

Sunghee Yun

以下将完成这项工作!

new_df = df.sort_values('abs', ascending=False).drop_duplicates(['date']).sort_values('date')

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

基于多个列值的功能的DataFrame排序

如何基于多个条件对数组进行排序?

Redis中的排序集基于多个条件

基于多个条件的PHP排序多维数组

排序:对多个表进行或条件

对Pandas Dataframe列中的列表进行排序

使用多个条件在PHP中对多维数组进行排序

根据多个条件对数组中的项目进行排序

在基于Spark Dataframe的API中的多个列上进行过滤

如何基于多个列的条件在Pandas中创建列总和?

按特定顺序对Pandas DataFrame中的列进行排序

基于多个条件对哈希数组进行排序和重新排列

如何基于多个if条件在foreach中对项目进行分组

基于Python中的多个复杂条件进行联接

基于多个条件对ggplot中的离散x轴进行排序

在Julia DataFrame中基于多个条件选择列

基于多个条件对多维数组进行排序

使用python sort函数对Pandas DataFrame中的值进行排序

在Excel中对多个条件进行排序和索引

Pandas DataFrame基于多个条件的分组添加新的列值

如何基于DataFrame中的多个条件对事件进行计数

R:基于dyplr中的多个条件进行汇总

在Python Pandas中基于DataFrame中的日期进行值计算?

根据一列的排序对多个Pandas Dataframe列进行排序

在Pandas DataFrame中对列进行排序

如何在Firebase中基于多个条件进行查询?

按列中的名称对pandas DataFrame中的数据进行排序

在 Pandas 中对 DataFrame 进行排序和切片

按多个条件对swiftui中的数组进行排序