sklearn是否使用熊猫索引作为功能?

史蒂夫

我正在将包含各种功能的pandas DataFrame传递给sklearn,并且我不希望估算器将dataframe索引用作功能之一。sklearn是否将索引用作功能之一?

df_features = pd.DataFrame(columns=["feat1", "feat2", "target"])
# Populate the dataframe (not shown here)
y = df_features["target"]
X = df_features.drop(columns=["target"])

estimator = RandomForestClassifier()
estimator.fit(X, y)
帕萨萨拉西·斯伯布拉杰(Parthasarathy Subburaj)

不,sklearn不要将索引用作您的功能之一。它实际上发生在这里,当您调用fit方法时,check_array将应用函数。现在,如果您深入研究check_array 函数,您会发现您正在使用np.array函数将输入转换为数组,该函数实质上是从数据帧中删除索引,如下所示:

import pandas as pd 
import numpy as np
data = [['tom', 10], ['nick', 15], ['juli', 14]] 
df = pd.DataFrame(data, columns = ['Name', 'Age']) 
df  

    Name    Age
0   tom     10
1   nick    15
2   juli    14

np.array(df)
array([['tom', 10],
       ['nick', 15],
       ['juli', 14]], dtype=object)

希望这可以帮助!

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章