熊猫| 根据条件复制数据框值

用户名

我有一个DataFrame，，X格式如下：

Value1   Value2   Value3   Month   Area

   1       1        3        0      1
   4       10       45       1      1
   ..      ..       ..       ..     .. 
   15      11       10       34     1
   10      21       12       35     1
   1       2        2        0      2
   3       4        4        1      2
   ..      ..       ..       ..     .. 
   27      39       21       34     2
   23      42       32       35     2
   ..      ..       ..       ..     ..

从DataFrame X，我想创建一个和DataFrame Y，除了Month和以外的其他列Area。的行Y必须相对于Area列，但具有的行的列值X+1。

例如，如果面积为1，则的第一行将Y包含的第二行的值X。

Value1   Value2   Value3   (Index) (Area)   

   4       10       45        0     1
   ..      ..       ..       ..     .. 
   10      21       12       34     1
   3       4        4        35     2
   ..      ..       ..       ..     .. 
   23      42       32       69     2
   ..      ..       ..       ..     ..

然后，我需要为每个删除X其中包含最后一个Month值的行Area。

然后DataFrame X将其转换为以下内容：

Value1   Value2   Value3   Month   Area

   1       1        3        0      1
   4       10       45       1      1
   ..      ..       ..       ..     .. 
   15      11       10       34     1
   1       2        2        0      2
   3       4        4        1      2
   ..      ..       ..       ..     .. 
   27      39       21       34     2
   ..      ..       ..       ..     ..

这是我目前的代码：

#Define a list of indexes of X to Drop
to_drop = list()
prev = None
y_index = 0
    
    
    #Iterate through X
    for index, row in x.iterrows():
        if not prev is None:
            
            #If the Area is the same as before
            if row['Area'] == prev :
                #Append to the Y dataframe and increase y's index
                y.loc[y_index] = row[y_columns]
                y_index+=1
            #We found a new index. We want to delete the previous one, which will have the last 
            #month value for the previous area
            else: to_drop.append(prev_index)
            
        prev_index= index
        prev = row['Area']
    
    print("Removing some rows...")
    x = x.drop(x.index[to_drop])

但是，当我检查新的时DataFrames，它们似乎丢失了很多信息，例如全部Areas被清除掉了。有更好的方法的想法，我可能做错了什么？

请注意，这是一个示例。数据集由几千个Area值组成，周围有多个30 Month值。

提前致谢。

斯科特·波士顿

尝试这个：

df['Month'] = df['Month'].shift()
df = df.dropna(subset=['Month'], axis=0)
df[df.duplicated('Area', keep='last')]

较旧的解决方案

drop_duplicates对你有用吗？

df.drop_duplicates(['Area'], keep='first')

输出：

   Value1  Value2  Value3  Month  Area
0       1       1       3      0     1
2       1       2       2      0     2

和，

df.drop_duplicates(['Area'], keep='last')

输出：

   Value1  Value2  Value3  Month  Area
1       4      10      45      1     1
3       3       4       4      1     2

更新，删除每个组中的最后一条记录：

df[df.duplicated('Area', keep='last')]

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-26

我来说两句

0 条评论

登录后参与评论

上一篇：在Xray中将黄瓜特征导出到.feature文件时缺少特征标题？

熊猫根据条件替换数据框值

根据条件修改熊猫数据框值

熊猫：根据条件将数据框中的值复制到多行

如何根据条件对熊猫数据框的行值进行排序？

熊猫数据框 - 根据条件设置列值

根据熊猫的条件更改数据框的所有值

根据条件在熊猫数据框中的多行中设置值

如何根据条件在熊猫数据框的多列上分配值

根据熊猫数据框中的条件为列分配值

根据多种条件替换熊猫数据框中的值

熊猫数据框根据条件更改列中的值

根据条件屏蔽熊猫数据框中的值

如何根据条件替换熊猫数据框中的值？

根据条件替换熊猫数据框列中的值

熊猫数据框根据条件冻结

根据条件合并熊猫数据框

根据条件合并行熊猫数据框

根据条件选择熊猫数据框的列

如何根据条件过滤熊猫数据框？

根据条件对熊猫数据框进行分组？

根据熊猫数据框的条件创建字典

根据条件熊猫过滤数据框行

根据条件移动熊猫数据框的行

在熊猫数据框列之间复制值

根据索引值拆分熊猫数据框

根据字典更改熊猫数据框值

根据最近的值合并熊猫数据框

根据列值重塑熊猫数据框

根据列值连接熊猫数据框

TOP 榜单

文章

熊猫| 根据条件复制数据框值

熊猫| 根据条件复制数据框值

尝试这个：

较旧的解决方案

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

SQL Server中的非确定性数据类型

Swift 2.1-对单个单元格使用UITableView

如何避免每次重新编译所有文件？

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

应用发明者仅从列表中选择一个随机项一次

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

HttpClient中的角度变化检测

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何了解DFT结果

Camunda-根据分配的组过滤任务列表

错误：找不到存根。请确保已调用spring-cloud-contract：convert

为什么此后台线程中未处理的异常不会终止我的进程？

构建类似于Jarvis的本地语言应用程序

使用分隔符将成对相邻的数组元素相互连接

您如何通过 Nativescript 中的 Fetch 发出发布请求？

通过iwd从Linux系统上的命令行连接到wifi（适用于Linux的无线守护程序）

使用React / Javascript在Wordpress API中通过ID获取选择的多个帖子/页面

使用 text() 獲取特定文本節點的 XPath