仅提取字母和第一位数字

我正在处理一个包含字母、特殊字符和数字的数据框。我的目标是提取所有字母和第一个数字。所有数字总是出现在字母和特殊字符之后;但是,某些字母可能会出现在特殊字符之后。请参阅下面的示例:

d = {'col1': ['A./B. 1234', 'CDEF/G5.','AB./C23']}
df = pd.DataFrame(data=d)
print(df)
#    col1
# 0  A./B. 1234
# 1  CDEF/G5.
# 2  AB./C23

我查找了许多变体,但我不知道如何处理特殊字符./等。

df.col1.str.extract('([A-Za-z\d]+)')
#    0
# 0  A
# 1  CDEF
# 2  AB

这给了我所有的字母和数字,直到它到达一个特殊字符。最终我想得到以下输出:

AB1
CDEFG5
ABC2

我是正则表达式的新手。

缺口

您需要提取包括第一个数字在内的所有字符,然后用空字符串替换任何非字母/数字字符:

d = {'col1': ['A./B. 1234', 'CDEF/G5.','AB./C23']}
df = pd.DataFrame(data=d)
df.col1.str.extract(r'^([^\d]+\d)').replace('[^A-Za-z0-9]', '', regex=True)

输出:

        0
0     AB1
1  CDEFG5
2    ABC2

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

整数的第一位和最后一位数字的和

在PHP中用*替换第一位和最后一位数字

检索数字的第一位数字

在Bash中提取字符串直到第一位数

从R中数值向量的每个元素中提取第一位数字

SED命令删除每行的第一位数字和空格

如何使用tesseract而不是仅读取第一位数字来读取完整的数字序列

增加数字,但始终保持第一位数字

如何获得数字的第一位数字

正则表达式匹配第一位数字和非法字符

确定第一位数

迭代一个txt文件中的所有数字,看看第一位和最后一位数字是否相同

将电话号码的第一位数字修剪为国际格式

GSub删除第一位数字之前的所有字符

正则表达式 Python:保留第一位数字

python pandas获取列值的第一位数字

电话号码验证。只允许 0 作为第一位数字

如何获得小数的小数部分的第一位数字?

输入框-防止用户输入0作为第一位数字

如何用第一位数字分隔列

如何删除PHP中的第一位数字

程序需要以更大的第一位数字显示变量

如何测试整数的第一位数字是否为7?

如何保护第一位数字并显示最后三位数字?

Benford's Law Java-从文件中读取的字符串数组中提取第一位数字?

不允许用户在UITextField中输入数字1作为第一位数字

Firebase .orderByChild - 尝试订购数字,但它只订购第一位数字

Bash脚本有助于从数字中获取第一位数字

Javascript - 如何总结一个数字的所有第一位和最后一位数字,直到只剩下两位数字?