如何使用 Sk-learn OneHotEncoder 对数据框中的两列或更多列进行编码?

洪阮

这是我的数据框

我想使用 sklearn OneHotEncoder 和 Column Transformer 对 2 列进行编码:行和名称。但是,我只能使用此代码对一列进行编码。

from sklearn.preprocessing import OneHotEncoder
from sklearn.compose import ColumnTransformer
X = new_df_cl.iloc[:,:-2].values
lines = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [4])], remainder='passthrough')
X = np.array(lines.fit_transform(X))
阿夫沙罗夫

转换器列表中元组的语法ColumnTransformer

(name, transformer, columns)

wherecolumns可以是列索引列表。因此,如果要转换索引 4 和 5 处的列,请按[4, 5]如下方式指定列

ColumnTransformer(
    transformers=[('encoder', OneHotEncoder(), [4, 5])],  # <-- here
    remainder='passthrough'
)

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何使用sklearn OneHotEncoder何时离开数值列呢?

使用python解释onehotencoder

OneHotEncoder categorical_features已贬值,如何转换特定列

scikit-learn:如何用管道组成LabelEncoder和OneHotEncoder?

在scikit-learn中使用OneHotEncoder为分类准备序数和名义特征

使用keras的sk-learn API时出错

如何使用pyspark对数据框中的两列进行数学运算

如何使Spark中的onehotencoder像熊猫中的onehotencoder一样工作?

KNN中的knn.score和准确性指标有什么区别-SK Learn

使用sklearn的OneHotEncoder删除列

sk-learn:fit()的错误采用2个位置参数,但在FeatureUnion中给出了3个

从Pandas形式的虹膜数据集转换为sk-learn形式的有效方法?

scikit-learn:ColumnTransformer和OneHotEncoder –如何为所有字段中的所有新分类级别提供错误信息?

如何在熊猫中编辑OneHotEncoder的实现过程?

如何通过比较两列对数据框进行排序

将Scikit-Learn OneHotEncoder与Pandas DataFrame一起使用

如何将数据框列的分类值转换为sckikit-learn中的一键编码列?

使用scikit学习OneHotEncoder时如何处理分类数据中的缺失值(NaN)?

使用dplyr对数据框的两列中的对象进行分类

sk-learn:无法训练具有大数据帧的决策树

Spark:在多个数据帧上使用相同的OneHotEncoder

为什么metric ='precomputed'在sk-learn的k最近邻中不起作用?

使用 python 多处理运行 sk-learn model.predict

如何在 OneHotEncoder 和 LabelEncoder 中做 inverse_transform?

使用sk-learn基于字符串特征预测数值特征

Scikit-Learn OneHotEncoder 无法正常工作?

在多列中使用 OneHotEncoder 并在列之间重复类别?

如何根据两列中相似字符的数量对数据框进行排序?

如何根据R中两列不匹配的值对数据框进行子集化?