如何在Pandas中为具有多个条件的一行设置样式？

算盘

我有一个数据框，我想要为其某些样式设置为行的索引在字典中显示。在尝试使用apply，applymap，具有row / column / IndexSlice的子集的一堆东西之后，我仍然没有找到解决方案

根据具有不同颜色的多个条件，为特定行设置不同的单元格样式。（由于需要以相同的方式将行和列写入excel，因此转置将不起作用（？！））
在1个功能中将特定行/“猫”的样式条件和颜色分组。
根据另一行但同一列中的单元格的值，有条件地对一行中的所有单元格进行样式设置（请参见所需结果）。

注意：某些行将被设置为“样式”，而另一些则不会。

第一个问题：cat1出现在字典中，因此我需要使用条件样式。我需要将行中的每个单元格通过条件以应用某种颜色。经过大量尝试，下面的代码“最接近”了潜在的解决方案，但是保存为excel时出现错误。（当我仅将代码用于“绿色”时，它完全可以工作）。

“ DataFrame的真值不明确。请使用a.empty，a.bool（），a.item（），a.any（）或a.all（）。”

d_functions_colors={'cat1': catone_color,'cat5': catfive_color, 'cat40':catforty_color}

        2020-12   2019-12   2018-12   2017-12    2016-12      ...
idx  
cat1        100       NaN        50        35          5      ...
cat2          5       NaN         7         3          2      ...
cat3       6.25       NaN      6.25      4.93       5.21      ...
avg_cat3      5         4         3         2          1      ...
max_cat3     10        20        10        30          1      ...  
cat4                                                          ...
cat5          5        20         8         9.5       25      ...
avg_cat5     10        15         8         9.5       20      ...
...

(the results for avg, max are calculated and added for some 'cats' beforehand based on multiple (other) data sources)

    def highlight_row_green(x):
        c0 = ''
        c1 = 'background-color: green'
        c2 = 'background-color: yellow'
        c3 = 'background-color: red'
         
        df1 = pd.DataFrame('', index=x.index, columns=x.columns)
    
        m1 = x.index.astype(str).str.contains('^cat1')
    
        mask = (x[m1] >= 50).reindex(x.index, fill_value=False)
    
        df1 = df1.mask(mask, c1)
        return df1
    
    def highlight_row_yellow(x):
        c0 = ''
        c1 = 'background-color: green'
        c2 = 'background-color: yellow'
        c3 = 'background-color: red'
         
        df1 = pd.DataFrame('', index=x.index, columns=x.columns)
    
        m1 = x.index.astype(str).str.contains('^cat1$')
    
        mask = (20 <= x[m1] < 50)
    
        df1 = df1.mask(mask, c2)
        return df1
    
    
    def highlight_row_red(x):
        c0 = ''
        c1 = 'background-color: green'
        c2 = 'background-color: yellow'
        c3 = 'background-color: red'
         
        df1 = pd.DataFrame('', index=x.index, columns=x.columns)
    
        m1 = x.index.astype(str).str.contains('^cat1$')
    
        mask = ( x[m1] < 20)
    
        df1 = df1.mask(mask, c3)
        return df1

    def pandastoExcel(path,filename,sheetname,my_dataframe):
    outputfilepath=(path+'\\'+filename)
    if len(sheetname)>=30:
        sheetname='Default'
    else:
        pass
    writer = pd.ExcelWriter(outputfilepath , engine='xlsxwriter')
    try:
        my_dataframe.to_excel(writer, sheet_name=sheetname,index=True)
    except Exception as e:
        print(str(e))
    writer.save()


df_output=df.style.\
    apply(highlight_row_green, axis=None).\
    apply(highlight_row_yellow, axis=None).\
    apply(highlight_row_red, axis=None)

第二个问题：我试图对它们进行分组，但出现相同的错误“ DataFrame的真值不明确。请使用a.empty，a.bool（），a.item（），a.any（）或a.all （）。”

def catone_color(x):
     c1 = 'background-color: green'
     c2 = 'background-color: yellow'
     c3 = 'background-color: red'
     c0 = '' 

     df1 = pd.DataFrame('', index=x.index, columns=x.columns)
     m1 = x.index.astype(str).str.contains('^cat1$')

     mask = (x[m1] >= 50).reindex(x.index, fill_value=False)
     masky = (20 <= x[m1] < 50)
     maskr = (x[m1] < 20)

     df1 = df1.mask(mask, c1)
     df1 = df1.mask(masky, c2)
     df1 = df1.mask(maskr, c3)
     return df1

df_output=df.style.apply(catone_color, axis=None)

第三个问题：（例如cat5），样式基于cat5_avg中的值。因此，2020 cat5_value的颜色基于2020 cat5_avg，2019 cat5_value的颜色基于2019 cat5_value，依此类推。

通过将数据帧中的两行（例如row_values，row_avg）和其他内容组合在一起进行了尝试，但远没有实现任何目的。

            2020-12   2019-12   2018-12   2017-12    2016-12      ...
    idx  
    cat1        100       NaN        50        35          5      ...
    cat2          5       NaN         7         3          2      ...
    cat3       6.25       NaN      6.25      4.93       5.21      ...
    avg_cat3      5         4         3         2          1      ...
    max_cat3     10        20        10        30          1      ...  
    cat4                                                          ...
    cat5          5        20         8         9.5       25      ...
    avg_cat5     10        15         8         9.5       20      ...
    ...

#Idea of what I'm trying to accomplish:
for cat5_value in row_cat_5:
    If cat5_value > avg_cat5_same column:
          color = 'green'
    elif cat5_value == avg_cat5_same_column:
          color = 'yellow'
    elif cat5_value < avg_cat5_same_column:
          color = 'red'
    else:
          color=''
    return 'background-color: %s' % color

#(Background color row cat_5 would be red,green,yellow,yellow,green).  

#What I've got left from trying:
    g= 'green'
    y = 'yellow'
    r = 'red'

    m1 = val.iloc[0, :] < val.iloc[1, :]
    m2 = val.iloc[0, :] == val.iloc[1, :]
    m3 = val.iloc[0, :] > val.iloc[1, :]

    df1 = pd.DataFrame('background-color: ', index=val.index, columns=val.columns)

    df1.iloc[:,0] = np.where(m1, 'background-color: {}'.format(g), df1.iloc[0, :])
    df1.iloc[:,0] = np.where(m2, 'background-color: {}'.format(y), df1.iloc[0, :])
    df1.iloc[:,0] = np.where(m3, 'background-color: {}'.format(r), df1.iloc[0, :])
    return df1

所需结果

先感谢您，

PS：衷心感谢所有贡献者，他们的回答是上述结果代码的基础。

算盘

用openpyxl解决

 from openpyxl import Workbook,load_workbook
 from openpyxl.styles import Color, PatternFill, Font, Border
 from openpyxl.styles import colors
 from openpyxl.cell import Cell

 d_functions_colors={'cat1': catone_color,
                      'cat5': catfive_color,'cat40':catforty_color}

 wb = load_workbook(outputfilepath)
 ws = wb.active

 for row in ws.iter_rows(min_row=ws.min_row, max_row=ws.max_row):
    if row[0] in d_functions_colors:
       row=d_functions_colors[row[0].value](row)

 def catone_color(row):
    for cell in row:            
        try:
          fl_cell=float(cell.value)
          if fl_cell>=50:
           #Green
           cell.fill = 
PatternFill(start_color='0000FF00',end_color='0000FF00',fill_type='solid')
          elif 50>fl_cell>=20:
           #yellow
           cell.fill = 
PatternFill(start_color='00FFFF00',end_color='00FFFF00',fill_type='solid')             
          elif 20 > fl_cell:
           #red
           cell.fill = 
PatternFill(start_color='FFFF0000',end_color='FFFF0000',fill_type='solid')
          else:
           pass
        except Exception as e:
           print(str(e))
    return row

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-25

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

如何在Pandas中为具有多个条件的一行设置样式？

如何在Pandas中为具有多个条件的一行设置样式？

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用