Python：获取“列表索引超出范围”错误；我知道为什么但不知道如何解决这个问题

scy0003

我目前正在从事一个数据科学项目。想法是清除“glassdoor_jobs.csv”中的数据，并以更易于理解的方式呈现它。

import pandas as pd

df = pd.read_csv('glassdoor_jobs.csv')

#salary parsing
#Removing "-1" Ratings
#Clean up "Founded"
#state field
#Parse out job description

df['hourly'] = df['Salary Estimate'].apply(lambda x: 1 if 'per hour' in x.lower() else 0)
df['employer_provided'] = df['Salary Estimate'].apply(lambda x: 1 if 'employer provided salary' in x.lower() else 0)
df = df[df['Salary Estimate'] != '-1']
Salary = df['Salary Estimate'].apply(lambda x: x.split('(')[0])
minus_Kd = Salary.apply(lambda x: x.replace('K', '').replace('$',''))

minus_hr = minus_Kd.apply(lambda x: x.lower().replace('per hour', '').replace('employer provided salary:', ''))

df['min_salary'] = minus_hr.apply(lambda x: int(x.split('-')[0]))
df['max_salary'] = minus_hr.apply(lambda x: int(x.split('-')[1]))

我在最后一行收到错误。挖掘了一下之后，我发现在 minus_hr 中，一些“薪资估算”只有一个数字而不是范围：

指数	薪资预估
0	150
1	58
2	130
3	125-150
4	110-140
5	200
6	67-77

等等。现在我试图弄清楚如何解决“列表索引超出范围”，并使 max_salary 与只有一个值的单元格的 min_salary 相同。

我还试图获得最低和最高工资之间的平均值，如果单元格只有一个值，则将该值设为平均值

所以最后，像索引 0 这样的东西看起来像：

指数	分钟	最大限度	平均数
0	150	150	150

恰兰海恩斯

您必须在某处添加条件语句。

df['min_salary'] = minus_hr.apply(lambda x: int(x.split('-')[0]) if '-' in x else x)

上面可能会这样做，或者您可以定义一个函数。

def max_salary(cell_value):
    if '-' in cell_value:
        max_salary = split(cell_value, '-')[1]
    else:
        max_salary = cell_value
return max_salary

df['max_salary'] = minus_hr.apply(lambda x: max_salary(x))


def avg_salary(cell_value):
    if '-' in cell_value:
        salaries = split(cell_value,'-')
        avg = sum(salaries)/len(salaries)
    else:
        avg = cell_value
return avg

df['avg_salary'] = minus_hr.apply(lambda x: avg_salary(x))

交换 min_salary 并重复

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-09-13

我来说两句

0 条评论

登录后参与评论

上一篇：为什么这个 rust 代码在没有文件时挂起，但在文件存在时运行良好？

Python：获取“列表索引超出范围”错误；我知道为什么但不知道如何解决这个问题

Python：获取“列表索引超出范围”错误；我知道为什么但不知道如何解决这个问题

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用