无法根据子字符串集过滤熊猫数据框

巴兰通吉夫

目的是找出一列中的每个单元格是否包含一组字符串中的一个字符串。

给定下面的df;

df = pd.DataFrame({'Date': ['1 December 2020', 'May 2020', 'Random value', 'may 2019']})

和一个标志子字符串

stk_list = ['December','May']

它应该返回

True; True; False; True

但是,使用下面的代码

stk_list = ['December','May']
df = pd.DataFrame({'Date': ['1 December 2020', 'May 2020', 'Random value', 'may 2019']})
dfxx=df['Date'].isin(stk_list)

它返回

False; False;False;False

我可以知道我在哪里做错了吗?

广晃

您可以regex为此目的使用

pattern = '|'.join(s.lower() for s in stk_list)

df.Date.str.lower().str.contains(pattern)

您可能需要进行修改,pattern以便仅检查整个单词:

pattern = r"\b({})\b".format('|'.join(s.lower() for s in stk_list))

这里\b表示单词boudary,因此该模式不会标记maybeTrue

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何根据列表从熊猫数据框中过滤子字符串?

根据完全匹配的字符串过滤熊猫数据框

根据列表中的部分字符串过滤熊猫(python)数据框

根据子字符串对熊猫数据框列进行排序

根据熊猫数据框中的另一列获取子字符串

根据指定列中的字符串值条目是否包含子字符串来分隔熊猫数据框

根据条件熊猫过滤数据帧(字符串拆分)

通过字符串末尾过滤熊猫数据框

解析字符串作为过滤熊猫数据框的条件

如何通过字符串过滤熊猫数据框?

根据条件熊猫数据框列删除字符串

根据列中的字符串过滤数据框

熊猫数据框列上的子字符串

熊猫数据框查找和子字符串

根据数据框中的子字符串对列求和

如何根据另一个数据框的完整字符串列过滤子字符串的 Pandas 数据框?

熊猫:根据从旧数据框中的字符串中提取的数据创建新的数据框

如何替换熊猫数据框中的字符串中的子字符串

熊猫数据框通过查找子字符串替换多列中的字符串

如何更新字符串的熊猫数据框列中的子字符串

根据字符串列表过滤大熊猫中的数据框

过滤特定字符串的数据框

根据条件在熊猫数据框列中的特殊字符上拆分字符串

熊猫数据框,根据其整数表示对字符串数据进行分组和排序

根据部分字符串值(也具有特殊字符)过滤数据框

熊猫使用DataFrame.query根据其字符串长度过滤字符串数据

如何删除熊猫数据框中具有特定字符的子字符串?

过滤熊猫数据框列中的字符串/浮点数/整数值

如何过滤包含字符串和浮点数的熊猫数据框?