如何通过索引而不是在熊猫中的名称pd.read_excel指定列dtype

合并

我需要从Excel读取数据,但是在执行此操作时,我不应该通过其名称指定列。如何使用索引设置数据类型?

例如:

df = pd.read_excel('file.xlsx', 
                 sheet_name='sheet1',
                 index_col=None, 
                 dtype={'column_x':str, 'column_y':str}, engine='openpyxl')

在这里,除了声明"column_x"和之外"column_y",我可以通过以下方式与他们联系:

dtype={df.colums[0]:str, df.colums[1]:str}

谢谢

马那金

使用,header=None然后按其索引位置访问列。

df = pd.DataFrame({'A' : [0,1,2,3], 'B' : ['A','B','C','A']})

print(df.dtypes)

A     int64
B    object
dtype: object


df.to_excel('file.xlsx'index=False)
df = pd.read_excel('file.xlsx',index_col=None)
print(df.dtypes)

A     int64
B    object
dtype: object

df = pd.read_excel('file.xlsx',index_col=None,
       header=None,dtype={0 : 'str', 1 : 'str'},skiprows=1) 
       # skip the header row otherwise all cols will be read as strings.

print(df.dtypes)

0    object
1    object
dtype: object

请注意,此后您需要手动设置列。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

熊猫read_csv通过列索引设置dtype(不是名称)

如何通过名称而不是通过索引访问TDBGrid列?

读取或通过to_csv编写时,Python Pandas read_excel dtype str用空格('')替换nan

使用read_excel(na =),如何指定多个NA字符串?

如何通过其索引而不是名称获取列?

熊猫read_excel返回PendingDeprecationWarning

熊猫read_excel()导入xlrd失败

在panda中使用read_excel函数浏览Excel文件中的所有列

熊猫read_excel保留A:Z列名称

熊猫read_excel(工作表名称=无)返回字符串字典,而不是数据帧?

无法使用read_excel从熊猫的xlsx文件读取日期列?

带有多个工作表和特定列的熊猫read_excel()

将read_excel放入数据框,并将文件名保留为列(熊猫)

如何通过名称而不是其索引为VBA的自动筛选功能指定列?

熊猫read_csv dtype指定除一列外的所有列

如何通过聚合摆脱熊猫中嵌套列的名称?

没有安装excel的熊猫read_excel

使用熊猫中的迭代名称通过索引重命名多列

从熊猫索引中检索列的名称

如何摆脱列/轴名称的名称显示在数据框熊猫python中的/ above索引顶部

Py2exe无法编译熊猫read_excel

熊猫Read_Excel日期时间转换器

熊猫在使用read_excel时不断重复行

熊猫read_excel()单元格换行

熊猫数据框在read_excel时更改浮点值

熊猫高级read_excel或ExcelFile.parse

Python Panda read_excel - 部分 io 名称的用户输入

通过索引符号而不是列名称选择数据框中的列

pandas read_excel:强制将同一列中的其他值转换为float的nan值