DataFrame:基于另一列中的单词创建新列

比阿特丽斯·阿尔维斯

新手程序员在这里寻求帮助。我有一个看起来像这样的数据框:

       Message  
0  "Blah blah $AAPL"
1  "Blah blah $ABT"      
2  "Blah blah $amzn"     
3  "Blah blah $AMZN"
4  "Blah blah $KO"
5  "Blah blah $fb"
6  "Blah blah $GOOGL"
7  "Blah blah $BA"    
8  "Blah blah $BMY"   

我想要的输出是一个新列,该列为我提供了推文中使用的Cashtag,无论它是大写还是小写。在此示例中,它将是:

       Message            Cashtag
0  "Blah blah $AAPL"      "$AAPL"
1  "Blah blah $ABT"       "$ABT"
2  "Blah blah $amzn"      "$AMZN"
3  "Blah blah $AMZN"      "$AMZN"
4  "Blah blah $KO"        "$KO"
5  "Blah blah $fb"        "$FB"
6  "Blah blah $GOOGL"     "$GOOGL"
7  "Blah blah $ba"        "$BA"   
8  "Blah blah $BMY"       "$BMY" 

如何获得所需的输出?

Noleli

这将从所有字符串中提取第一个现金标签:

df['Cashtag'] = df['Message'].str.extract(r'(\$[A-Za-z]{1,4})', expand=False)

查看有关Series.str.extract的文档

更好的是,因此您以后可以按现金标签进行分组,建议您也将它们转换为全部大写:

df['Cashtag'] = df['Message'].str.extract(r'(\$[A-Za-z]{1,4})', expand=False).str.upper()

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何基于另一列的数值创建新列

如何基于另一列创建新的列?

R - 基于另一列差异创建新列

如何创建基于同一行中另一列的值命名的新列?

在数据框中创建基于条件和另一列值的新列

基于Pandas DataFrame中另一列的总和列

如何基于另一个 DataFrame 中的列在 Pandas DataFrame 中创建新列?

从Python中的另一列创建新列

从R中的另一列创建新列

根据另一列中的值创建新列

Pandas:重新排序基于另一列创建的组中一列中的值

数据框,使用基于另一列索引的值创建一个新列

R:如何创建一个基于另一列某些值的新列?

检查列中的某些单词并创建另一列以根据存在的单词分配值

如何在DataFrame中创建一个新列,以在另一列中显示模式?

如何基于字典和另一列之间的匹配项创建新的df列

基于另一列的条件子字符串创建新的 df 列

R使用函数基于另一列创建新列

在R是/否的基础上基于另一列创建新列

基于另一列生成新列

熊猫基于拆分另一列添加新列

基于另一列添加新列

基于分类列和另一列中的值创建列

根据另一列的字符串搜索在Spark Dataframe中创建具有功能的新列

使用grepl创建基于另一列的列

如何基于另一列中的值将值移到新列中

如何基于R中另一列中的最高编号来计算新列?

Pandas Dataframe:计算一列中的唯一单词并返回另一列中的计数

Python Dataframe:基于另一列更改列的值?