从()提取特定信息的最简单方法是什么?

Lzypenguin:

我要遍历的行如下所示:

random text and A08524SDD here (00-04) more random text
lame text (junk data) more text (08-12) more text 4000 5553
random text and numbers 44553349 (2008) 
random text (2005) junk text (junk)
nothing important (13-15) not important (not important)

我试图弄清楚如何仅从括号中拉出日期(范围或一年),而不从括号中拉出其他随机垃圾。

当前正在使用它,但是它也返回随机文本:

date = re.findall('\(([^)]+)', line)

编辑:字符串中的每一行我一次遍历1行。它不是一个字符串。我有一个for循环,正在搜索每一行并尝试从每一行提取日期范围。另外,随机文本中包含随机数,因此我不能只在整个字符串中搜索##-##或####。它必须用()括起来。

Edit2:@CarySwoveland回答了我的原始问题。值得一提的是,我确实有几行看起来像这样,如果也可以包含它们,那将是不错的选择。

random text and numbers 44553349 (2008 important text) 
random text (2005 important text) junk text (junk) 55555555 (08-09 important text)
nothing important (13-15) not important (not important)(2008 important text)

在都以##-##或####开头的多于1()的行中,我需要使用文本抓住它们。在大约35,000行文本中,只有大约50左右有这些随机问题,我不介意手工完成。但是,如果存在解决方案,则可以很好地实现。

谢谢所有发布者!这已经极大地帮助了我!!!

卡里(Cary Swoveland)

您可以使用以下正则表达式。

(?m)(?<=\()(?:\d{4}|\d{2}-\d{2})(?=\))

Regex演示 < ¯\ _(tsu)_ / / > Python演示

Python的regex引擎执行以下操作。

(?m)           multiline mode
(?<=\()        match is preceded by '(' (positive lookbehind)
(?:            begin non-capture group
  \d{4}        match 4 digits          
  |            or
  \d{2}-\d{2}  match 2 digits, a hyphen, 2 digits
)              end non-capture group
(?=\))         match is followed by ')' (positive lookahead)

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

zgrep特定模式的最简单方法是什么?

记录信息或调试Windows服务的最简单方法是什么?

提取请求的Authorization标头的值的最简单方法是什么?

在python中提取二维矩阵子集的最简单方法是什么?

在特定日期(mysql-php)中计算特定值的最简单方法是什么?

检查传入请求是否包含特定标头值的最简单方法是什么

从HTML文件输出两个特定字段的值的最简单方法是什么?

从Go应用程序刷新特定浏览器标签的最简单方法是什么?

以这种特定方式比较真实性的最简单方法是什么?

定位特定块级元素的最简单方法是什么

从C ++调用Java方法的最简单方法是什么?

持久化Java对象的最简单方法是什么?

xslt:做否定选择的最简单方法是什么?

反应访问语言环境的最简单方法是什么

在本地安装Drupal的最简单方法是什么?

打印Java数组的最简单方法是什么?

实现依赖注入的最简单方法是什么?

在 Python 中制作 ByteEnum 的最简单方法是什么?

安装gem的最简单方法是什么?

复制活动记录记录的最简单方法是什么?

在nginx上启用PHP的最简单方法是什么?

快速崩溃的最简单方法是什么?

创建坐标列表的最简单方法是什么?

将文件读入String的最简单方法是什么?

使用Python进行SSH的最简单方法是什么?

在Python中转义HTML的最简单方法是什么?

逆转ArrayList的最简单方法是什么?

使C ++程序崩溃的最简单方法是什么?

安装缺少的Perl模块的最简单方法是什么?