从数据框的每一行中删除日期时间字符串

用户341383

我有一个看起来像这样的数据框:

   Film      Description       
0  Batman    Viewed in 2021-10-04T14:30:31Z City Hall, London
1  Superman  Aired 2012-01-04R11:01:10Z in the USA first
2  Hulk      2010-07-04S07:22:02Z Still being produced

我想从“说明”列的每一行中删除日期时间,如下所示:

    Film      Description      
0   Batman    Viewed in City Hall, London
1   Superman  Aired in the USA first
2   Hulk      Still being produced

我已经尝试过此字符串正则表达式:

df['Description'] = df['Description '].str.replace(r'\^(\d{4}-\d{2}-\d{2}T\d{2}:\d{2}:\d{2})Z', '')
理查德·捷克

\^ 匹配插入符号。

除此之外T,我看RS在日期时间的邮票,他们必须加入。

使用

\s*\b\d{4}-\d{2}-\d{2}[TRS]\d{2}:\d{2}:\d{2}Z\b

证明

解释

--------------------------------------------------------------------------------
  \s*                      whitespace (\n, \r, \t, \f, and " ") (0 or
                           more times (matching the most amount
                           possible))
--------------------------------------------------------------------------------
  \b                       the boundary between a word char (\w) and
                           something that is not a word char
--------------------------------------------------------------------------------
  \d{4}                    digits (0-9) (4 times)
--------------------------------------------------------------------------------
  -                        '-'
--------------------------------------------------------------------------------
  \d{2}                    digits (0-9) (2 times)
--------------------------------------------------------------------------------
  -                        '-'
--------------------------------------------------------------------------------
  \d{2}                    digits (0-9) (2 times)
--------------------------------------------------------------------------------
  [TRS]                    any character of: 'T', 'R', 'S'
--------------------------------------------------------------------------------
  \d{2}                    digits (0-9) (2 times)
--------------------------------------------------------------------------------
  :                        ':'
--------------------------------------------------------------------------------
  \d{2}                    digits (0-9) (2 times)
--------------------------------------------------------------------------------
  :                        ':'
--------------------------------------------------------------------------------
  \d{2}                    digits (0-9) (2 times)
--------------------------------------------------------------------------------
  Z                        'Z'
--------------------------------------------------------------------------------
  \b                       the boundary between a word char (\w) and
                           something that is not a word char

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

删除数据框中每一行列中字符串中的重复单词

为熊猫数据框的每一行替换一列中的字符串

删除每一行中的字符串

如何在pyspark的数据框中的每一行中查找字符串

为数据框中的每一行创建json字符串

在Python数据框中的每一行的两个子字符串之间选择字符串

为熊猫数据框中的每一行从左侧提取子字符串到特定字符?

将数据框的每一行转换为字符串

如何从字符串中的每一行中删除最后一个逗号?

如何从多行字符串的每一行中删除前 40 个字符?

如何从字符串中提取特定字符串,对于数据框中的每一行;并为每个项目计数

如何在连续写入的日志文件的每一行中添加日期字符串

如何在连续写入的日志文件的每一行中添加日期字符串

如何删除熊猫数据框中的每一行?

使用Ansible删除文件中字符串之前的每一行

用bash中的特定字符串删除每一行

如何从日志文件中删除以特定字符串开头的每一行?

根据每一行中的字符串对数据进行分类

Notepad ++:如何删除以字符串+前一行开头的每一行

如何在pandas数据框中创建新列,并用不同的方式替换每一行中的一部分字符串?

在日期时间值之前和之后为数据框中的每一行生成偏移量

c# - 如何删除多行文本框一行中的字符串

从Python数据框的一列中的每一行中删除前x个字符

如何在新列的数据帧的每一行中添加字符串和特殊字符?

如何删除某个模式或文件中的字符串之后的每一行的其余部分?

使用正则表达式从文本文件的每一行中删除子字符串

有没有办法从数据框中的一行中的所有元素中删除子字符串

如何使用python计算数据帧中每一行中某些字符串/单词的出现

VB .Net在文本框的每一行的开头和结尾添加字符串