基于pandas中的多个条件对DataFrame进行排序

非线性

我有一个类似于以下的 DataFrame

date      mood    score   count  avg       abs
23/12/18 negative -50.893   137  -0.371     50.893
23/12/18 neutral  0.2193    10   0.0219     0.2193
23/12/18 positive 336.5098  673  0.5000     336.5098
24/12/18 positive 91.2414   232  -0.393     91.2414
24/12/18 neutral  0.063     14   0.0045     0.063
24/12/18 negative -649.697  1184 0.5487     649.697
25/12/18 negative -72.4142  8   -9.0517     72.4142
25/12/18 positive   0       0    0          0
25/12/18 neutral  323.0056  173 1.86708     323.0056
26/12/18 negative -12.0467   15 -.8031      12.0467

我想对这个数据集应用以下条件。

Con: if the absolute value(abs) score on a date is the greatest (of 3 moods), keep that date only together with its other attributes. 
Con: No duplicate date is to be kept. So the dataset will be reduced quite a lot compared to its original size.

预期产出

date       mood_corrected   score   count   avg          abs
23/12/18    positive      336.5098  673    0.50001456   336.5098
24/12/18    negative      649.697   1184   0.54873057   649.697
25/12/18    neutral       323.0056  173    1.86708439   323.0056
26/12/18    negative      -12.0467  15     -0.8031      12.0467

我的代码

import pandas as pd 

df =pd.read_csv('file.csv')

new_df= df.sort_values('abs', ascending=False).drop_duplicates(['date','mood'])

虽然我得到的结果是根据绝对值 **(abs)** 对数据集进行排序，但我仍然拥有完整的数据集。它没有减少。任何帮助表示赞赏。非常感谢。

注意：我查看了 stackoverflow，但没有发现非常相似的问题。

Sunghee Yun

以下将完成这项工作！

new_df = df.sort_values('abs', ascending=False).drop_duplicates(['date']).sort_values('date')

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-3

我来说两句

0 条评论

登录后参与评论

基于多个条件对ggplot中的离散x轴进行排序

基于多个条件对多维数组进行排序

如何基于DataFrame中的多个条件对事件进行计数

Redis中的排序集基于多个条件

如何基于多个条件对数组进行排序？

对Pandas Dataframe列中的列表进行排序

在Pandas DataFrame中对列进行排序

Pandas DataFrame基于多个条件的分组添加新的列值

排序：对多个表进行或条件

R：基于dyplr中的多个条件进行汇总

如何在Firebase中基于多个条件进行查询？

如何基于多个if条件在foreach中对项目进行分组

基于Python中的多个复杂条件进行联接

在Excel中对多个条件进行排序和索引

使用多个条件在PHP中对多维数组进行排序

根据多个条件对数组中的项目进行排序

按多个条件对swiftui中的数组进行排序

在Julia DataFrame中基于多个条件选择列

在基于Spark Dataframe的API中的多个列上进行过滤

基于多个条件对哈希数组进行排序和重新排列

在Python Pandas中基于DataFrame中的日期进行值计算？

如何基于多个列的条件在Pandas中创建列总和？

基于多个条件的PHP排序多维数组

基于多个值对哈希数组进行排序

基于多个值对数组进行排序

Excel：基于多个列对行进行排序

按列中的名称对pandas DataFrame中的数据进行排序

对pandas数据框中的多个文本列的值进行排序

基于多个列值的功能的DataFrame排序

TOP 榜单

文章

基于pandas中的多个条件对DataFrame进行排序

基于pandas中的多个条件对DataFrame进行排序

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何正确比较 scala.xml 节点？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

在令牌内联程序集错误之前预期为 ')'

数据表中有多个子行，asp.net核心中来自sql server的数据

VBA 自动化错误：-2147221080 (800401a8)

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何在JavaScript中获取数组的第n个元素？

检查嵌套列表中的长度是否相同

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

ES5的代理替代

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

如何监视应用程序而不是单个进程的CPU使用率？

如何检查字符串输入的格式

解决类Koin的实例时出错

如何自动选择正确的键盘布局？-仅具有一个键盘布局