在for循环中使用Sklearn的LabelEncoder错误

负相关性

我正在使用spyder 2运行Python 3，并且在尝试运行此代码时：

from sklearn.preprocessing import LabelEncoder
cv=train.dtypes.loc[train.dtypes=='object'].index
print (cv)

le=LabelEncoder()
for i in cv:
    train[i]=le.fit_transform(train[i])
    test[i]=le.fit_transform(test[i])

我收到此错误：

le=LabelEncoder()
for i in cv:
    train[i]=le.fit_transform(train[i])
    test[i]=le.fit_transform(test[i])


Traceback (most recent call last):

  File "<ipython-input-5-8739984f61b2>", line 3, in <module>
    train[i]=le.fit_transform(train[i])

  File "C:\Users\myname\Anaconda3\lib\site-packages\sklearn\preprocessing\label.py", line 127, in fit_transform
    self.classes_, y = np.unique(y, return_inverse=True)

  File "C:\Users\myname\Anaconda3\lib\site-packages\numpy\lib\arraysetops.py", line 195, in unique
    perm = ar.argsort(kind='mergesort' if return_index else 'quicksort')

TypeError: unorderable types: str() > float()

奇怪的是，如果我在数据中的指定列上调用编码器，则输出成功。例如：

le.fit_transform(test['Race'])

结果是：

le.fit_transform(test['Race'])
Out[7]: array([2, 4, 4, ..., 4, 1, 4], dtype=int64)

我试过了：

float(le.fit_transform(train[i]))
str(le.fit_transform(train[i]))

两者都不起作用。

有人可以帮我吗？

马文·塔森伯格（Marvin Taschenberger）

也有同样的问题。原来我错过了检查缺少的值。检查是否还有剩余（针对您的情况）：

print(train.apply(lambda x : sum(x.isnull())))
print(test.apply(lambda x : sum(x.isnull())))

如果您有一些用参数（均值，中值，模数...）替换它们，或者只是将它们编码为字符串，即对于任意变量VAR：

parameter = train[VAR].mean() # parameter = "Nan"
train[VAR].fillna(parameter, inplace = True )

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-3

我来说两句

0 条评论

登录后参与评论

上一篇：jQuery datatable-设置列宽并换行

在For Of循环中使用对象

在for循环中使用指针

在循环中使用“ ..”

在循环中使用StreamWriter时出现“ Stream not Writable”错误

在for循环中使用增量

在for循环中使用setTimeout

在For循环中使用Timer（）

在循环中使用stringstream

在for循环中使用setTimeout

在for循环中使用变量，在next for循环中使用

在循环中使用getpixel

在for循环中使用宏

在for eachrow循环中使用变量会导致错误

Lambda在for循环中使用时传递错误的参数

在for循环中使用Groupby

在循环中使用ffmpeg时出现奇怪的错误

在循环中使用NSDecimalNumber？

在For循环中使用Grep

在循环中使用sed

在for循环中使用if语句

循环中使用SQL查询的自动化错误

在循环中使用getline（）时出现分段错误

在循环中使用时 zip 输出在错误的位置

在 for 循环中使用 fprintf 会提供错误的值

在 for 循环中使用逗号

在 FOR 循环中使用 FORFILES 并尝试覆盖错误

在循环中使用 setValue() 会返回“未捕获的错误”

在 for 循环中使用 split()

在 for 循环中使用断言

TOP 榜单

文章

在for循环中使用Sklearn的LabelEncoder错误

在for循环中使用Sklearn的LabelEncoder错误

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

SQL Server中的非确定性数据类型

Swift 2.1-对单个单元格使用UITableView

如何避免每次重新编译所有文件？

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

应用发明者仅从列表中选择一个随机项一次

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

HttpClient中的角度变化检测

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何了解DFT结果

Camunda-根据分配的组过滤任务列表

错误：找不到存根。请确保已调用spring-cloud-contract：convert

为什么此后台线程中未处理的异常不会终止我的进程？

构建类似于Jarvis的本地语言应用程序

使用分隔符将成对相邻的数组元素相互连接

您如何通过 Nativescript 中的 Fetch 发出发布请求？

通过iwd从Linux系统上的命令行连接到wifi（适用于Linux的无线守护程序）

使用React / Javascript在Wordpress API中通过ID获取选择的多个帖子/页面

使用 text() 獲取特定文本節點的 XPath