正则表达式：无法在另一个站点中完成的jupyter笔记本中复制预期的输出

人

我的正则表达式表达式匹配其他意外组。我的目标是提取指定格式的日期（以字母表示的月份后跟年份，例如2009年3月），但是该表达式匹配并捕获其他格式，例如2009年3月20日。输入如下。

df5 = pd.Series(["04/20/2009", "04/20/09", "4/20/09", "4/3/09", "Mar-20-2009", "Mar 20, 2009", "March 20, 2009", "Mar. 20, 2009", "Mar 20 2009", "20 Mar 2009","20 March 2009", "20 Mar. 2009", "20 March, 2009", "Mar 20th, 2009", "Mar 21st, 2009", "Mar 22nd, 2009", "Feb 2009", "Sep 2009", "Oct 2010", "6/2008","12/2009", "2009", "2010"])

我使用的regex表达式df5.str.extractall(r'(?P<date>(?:Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)[a-z., -]*\d{4})')然后在regex101网站上重新检查了我的表达式并对其进行了更改。更改的表达式如下

[^ ](?:Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)[a-z., -]*\d{4}

但是更改后的表达式与数据框中的任何值都不匹配，而使用更改后的表达式，我可以在regex101网站上获取必要的[输出]。我要去哪里错了？

李维

第一个看起来不错，您只需要以一个换行符开始^：

df5.str.extractall(r'^(?P<date>(?:Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)[a-z., \-]*\d{4})')

16 0      Feb 2009
17 0      Sep 2009
18 0      Oct 2010

编辑：

您可能需要将该空间添加为必填项，因此请将其从方括号中删除：

df5.str.extractall(r'^(?P<date>(?:Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)[a-z.,\-]* \d{4})')

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-25

我来说两句

0 条评论

登录后参与评论

上一篇：将朱利安日期格式化为常规日期后出错

匹配直到正则表达式中的另一个表达式

正则表达式，用于基于记事本++中的另一个文本替换文本

在另一个正则表达式中找不到正则表达式

正则表达式：无法在另一个站点中完成的jupyter笔记本中复制预期的输出

正则表达式：无法在另一个站点中完成的jupyter笔记本中复制预期的输出

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID