熊猫align（）函数：示例

避震：

我碰到了这段代码

app_train_poly, app_test_poly = app_train_poly.align(app_test_poly, join = 'inner', axis = 1)

这里app_train_poly和app_test_poly是熊猫数据框。

我知道使用align（）可以对这两个数据帧进行某种组合，但是我无法直观地看到它实际上是如何工作的。

我搜索了文档，但找不到任何说明性示例。

安德鲁·盖伊（Andrew Guy）：

您处于正确的轨道，除了DataFrame.align不合并两个数据框，而是将它们对齐，以便两个数据框具有相同的行和/或列配置。让我们尝试一个例子：

使用一些描述性的列名和玩具数据初始化两个数据框：

df1 = pd.DataFrame([[1,2,3,4], [6,7,8,9]], columns=['D', 'B', 'E', 'A'], index=[1,2])
df2 = pd.DataFrame([[10,20,30,40], [60,70,80,90], [600,700,800,900]], columns=['A', 'B', 'C', 'D'], index=[2,3,4])

现在，让我们自己查看这些数据帧：

print(df1)

   D  B  E  A
1  1  2  3  4
2  6  7  8  9

print(df2)

     A    B    C    D
2   10   20   30   40
3   60   70   80   90
4  600  700  800  900

让我们对齐这两个数据框，按列对齐（axis=1），然后对列标签执行外部联接（join='outer'）：

a1, a2 = df1.align(df2, join='outer', axis=1)
print(a1)
print(a2)

   A  B   C  D  E
1  4  2 NaN  1  3
2  9  7 NaN  6  8
     A    B    C    D   E
2   10   20   30   40 NaN
3   60   70   80   90 NaN
4  600  700  800  900 NaN

这里需要注意的几件事：

中的列df1已重新排列，因此与中的列对齐df2。
有一个标记为'C'已添加到df1的列，以及一个标记为'E'已添加到的列df2。这些列已填充NaN。这是因为我们在列标签上执行了外部联接。
DataFrame内部的值均未更改。
请注意，行标签未对齐；df2有3和4，而df1没有。这是因为我们要求对齐列（axis=1）。

如果我们在行和列上都对齐，但是将join参数更改为，会发生'right'什么？

a1, a2 = df1.align(df2, join='right', axis=None)
print(a1)
print(a2)

     A    B   C    D
2  9.0  7.0 NaN  6.0
3  NaN  NaN NaN  NaN
4  NaN  NaN NaN  NaN
     A    B    C    D
2   10   20   30   40
3   60   70   80   90
4  600  700  800  900

注意：

仅df2保留在“右侧”数据框（）中找到的列和行。列'E'不再存在。这是因为我们在列和行标签上都进行了正确的联接。
带有标签2和的行3已添加到df1，并用填充Nan。这是因为我们要求对行和列（axis=None）都进行对齐。
现在，行标签和列标签都已对齐。
同样，请注意，数据框内的实际值均未更改。

最后，让我们使用join='inner'和axis=1查看问题中的代码：

a1, a2 = df1.align(df2, join='inner', axis=1)
print(a1)
print(a2)

   D  B  A
1  1  2  4
2  6  7  9
     D    B    A
2   40   20   10
3   90   70   60
4  900  700  600

仅列标签对齐（axis=1）。
只有两者中都存在df1并df2保留的列标签（join='inner'）。

总而言之，DataFrame.align()当您要确保两个数据帧之间的行和/或列的排列是相同的，而无需更改两个数据帧中包含的任何数据时，请使用此方法。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-06-1

我来说两句

0 条评论

登录后参与评论

熊猫中的loc函数

MySQL AVG（）函数示例

什么是Go示例函数？

Python lambda函数动态创建（熊猫示例）

回调函数示例

JavaScript-reduce（）函数的示例

函数专业化/重载规则示例

从数据框熊猫python中删除示例

Python和导入子模块-熊猫示例

熊猫分配Lambda函数

Haskell示例中的函数组成

C ++虚函数简单示例

熊猫If函数或groupby

在熊猫列上应用函数

基于字典的示例熊猫

熊猫数据框示例

Firebase示例函数“ generateThumbnail”将不会部署

使用假设重复输入的熊猫指数示例

函数“定期返回”的错误示例？

熊猫DateOffset函数

Sass函数简单示例给出错误

用熊猫函数计数

熊猫udf showString错误的简单示例

python中的分布函数示例

来自famo.us示例的Align和Orign与示例中的行为不同

了解 Python 嵌套函数示例

表函数示例

不从函数导入熊猫

类装饰器函数示例

TOP 榜单

文章

熊猫align（）函数：示例

熊猫align（）函数：示例

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何正确比较 scala.xml 节点？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

在令牌内联程序集错误之前预期为 ')'

数据表中有多个子行，asp.net核心中来自sql server的数据

VBA 自动化错误：-2147221080 (800401a8)

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何在JavaScript中获取数组的第n个元素？

检查嵌套列表中的长度是否相同

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

ES5的代理替代

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

如何监视应用程序而不是单个进程的CPU使用率？

如何检查字符串输入的格式

解决类Koin的实例时出错

如何自动选择正确的键盘布局？-仅具有一个键盘布局