Diviser une série de Pandas et les attribuer dans des colonnes séparées

aBiologiste

J'ai cette trame de données suivante (df):

mut   gene   pvalue    chrom
1:23456_A>G  0.005     chr1  
2:28484_A>G  0.0001    chr2
4:47629_A>G  0.05      chr4
3:88382_A>G  0.00001   chr3
10:88273_A>G 0.005    chr10

[30 rows x 4 columns]

J'essaie de créer quatre colonnes avec leurs étiquettes de nom de colonne à partir de la colonne "mut" de df et je les ai affectées dans df_new nouvellement créé qui ressemble à ceci

chr    st    ref   alt 
1     23456   A     G  
2     28484   A     G  
4     47629   A     G

La trame de données résultante (df_new) est essentiellement une extraction de la colonne mut de df et ensuite une séparation de chaque partie de la chaîne, c'est-à-dire: split (":") puis split ("_") et enfin split (">") où nous nous retrouvons avec 4 parties du champ d'origine 1 23456 AG, puis placées dans leurs colonnes.

Voici ma tentative:

df_new["chr"], df_new["st"], df_new["ref"],    
df_new["alt"] = df.mut.str.split("[:_>]")

mais je me retrouve avec un message d'erreur comme suit:

ValueError: too many values to unpack (expected 4)

une simple instruction print révèle le résultat de cette ligne de code:

 df.mut.str.split("[:_>]")

comme:

0   [1, 23456, A, G]  
1   [2, 28484, A, G]
        .
        .
        .

Existe-t-il un moyen de résoudre ce problème dans les pandas où vous créez une nouvelle trame de données à partir de la séparation des champs de chaîne en 4 colonnes avec leurs étiquettes de colonnes incluses?

des murs

Essayons .str.split(expand=True)

df2=df.mut.str.split('[:_>]',expand=True)
df2.columns=['chr','st','ref','alt']



 chr     st ref alt
0   1  23456   A   G
1   2  28484   A   G
2   4  47629   A   G
3   3  88382   A   G
4  10  88273   A   G

Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.

En caso de infracción, por favor [email protected] Eliminar

Editado en2021-01-25

Déjame decir algunas palabras

0Comentarios

Iniciar sesiónRevisión de participación posterior

Anterior:Django: ¿no puede encontrar el modelo al insertar valores en el modelo desde el formulario html?

TOP Lista

Artículos

Diviser une série de Pandas et les attribuer dans des colonnes séparées

Diviser une série de Pandas et les attribuer dans des colonnes séparées

¿Cómo ocultar la aplicación web de los robots de búsqueda? (ASP.NET)

¿Precedencia de operadores?

Ver todos los comentarios en un video de YouTube

Limitar las entradas de One2many Lines en odoo

Leer Azure Key Vault Secret de la aplicación Function

Comparer des images dans Pygame (pas pixel par pixel)

Declaración if simple en intérprete de python

Extraction du nœud enfant de la réponse JSON à l'aide du script SoapUI-Groovy

Error de menú desplegable en Bootstrap 4

Cómo conectar Flutter con MongoDB

Importar archivo js con TypeScript 2.0

Validación de formulario Angular 4

¿La mejor manera de construir la GUI de Java Swing?

La mejor manera de iterar SortedSet / SortedMap en Java al revés

Estructura de la carpeta del proyecto Spring Boot para el cliente de descanso

BeautifulSoup: extraer texto de la etiqueta de anclaje

Cerrar el menú de material angular desde el controlador

marco de datos de Python: eliminar filas con claves externas faltantes

Abreviar el vector de nombres en R, usando la biblioteca stringr

Eliminar la barra de menú de la aplicación Electron

List <string> devuelve como System.Collections.Generic.List en HttpPost con MVC