将pandas数据框转换为keras分类

亚力山大

我正在尝试预处理python中的数据以用于深度学习keras函数。

我categorical crossentropy在模型拟合中用作损失函数。它需要分类变量作为目标。

我的目标数据样本：

    y_train = y_train.astype('category')
    y_train.head()

当我尝试将数据框列转换为分类列时：

    num_classes=2
    y_train = keras.utils.to_categorical(y_train, num_classes)

产生错误：IndexError: index 1 is out of bounds for axis 1 with size 1。

如何正确转换数据？

顺便说一下，如果我有3800个观测值的样本，每个样本都具有2300个数字（float32）特征，那么哪种keras模型更适合于二进制分类？这些功能主要描述图形对象。

艾奥尼斯·纳西奥斯（Ioannis Nasios）

不幸的是，我没有设法重现您的错误。运行：

a=pd.DataFrame(np.concatenate([np.zeros(3),np.ones(3)]) ).astype('int').astype('category')
from keras.utils import to_categorical
to_categorical(a, 2)

我得到一个输出：

array([[1., 0.],
       [1., 0.],
       [1., 0.],
       [0., 1.],
       [0., 1.],
       [0., 1.]], dtype=float32)

也许是版本问题！

好消息是您不必使用categorical_crossentropy二进制分类问题。您可以使用binary_crossentropy损失并以y_train作为目标来进行建模。

关于您最后一个关于哪种keras模型更适合于二进制分类的请求，Keras预训练模型正在引用图像。您似乎拥有表格数据，尽管您将无法使用经过预先训练的模型，但是您将必须自己运行自定义模型。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-27

我来说两句

0 条评论

登录后参与评论

将连续数据框转换为分类

将 sklearn 数据框转换为 Pandas 数据框，保留分类标签

在Pandas数据框中将连续数据转换为分类数据

将数据框列从数值转换为分类值

将pandas数据框转换为列表

将Pandas数据框转换为字典

将 xml 转换为 Pandas 数据框

将Pandas数据框转换为序列

将ndarray转换为pandas数据框

将json转换为pandas数据框

将XML转换为pandas数据框

将字典转换为Pandas数据框

将pandas数据框转换为PySpark数据框

将Geopandas地理数据框转换为Pandas数据框

将Pandas数据框转换为Spark数据框错误

将Pandas数据框转换为Dask数据框

在Pandas数据框中转换分类数据

将pandas数据框转换为json对象-pandas

将字典的特定字典转换为Pandas数据框-Pandas

将Pandas数据框转换为Pandas系列

如何将 XML 数据转换为 Pandas 数据框？

将tensorflow数据集转换为pandas数据框

将json数据转换为pandas数据框

将IEX Finance API数据转换为Pandas数据框

将Pandas数据框内的列表转换为新数据框

使用 Pandas 将 dict 数据转换为数据框

将 json 数据集转换为 pandas 数据框

将分类数据转换为虚拟集

将分类数据转换为数值向量

TOP 榜单

文章

将pandas数据框转换为keras分类

将pandas数据框转换为keras分类

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）