Extraire un tableau d'une feuille de calcul sous une certaine condition

John PS

J'ai des centaines de fichiers Excel (.xls) et chacun d'eux a (sur une ligne aléatoire) une "table", qui a trois colonnes chacune (Station, Paramètre et Unité). Je veux écrire un script qui lit tous les fichiers et quand il lit ces trois cellules (Station, Paramètre, Unité) ensemble sur une seule ligne, il commence à copier chaque ligne ci-dessous jusqu'à ce qu'elle atteigne la fin du tableau. À la fin de chaque table, il y a toujours trois NA. Mais la fin du tableau n'est pas la fin du fichier, il y a plus de données ci-dessous, mais je ne veux pas de ça.

Mon plus gros problème est que puisque je ne sais pas dans chaque ligne le tableau sera, je dois dire à R de lire toutes les lignes et de le détecter, ce que je ne peux pas faire.

Ci-dessous, j'ai visualisé un exemple de table et j'ai également écrit le code pour que vous puissiez le reproduire dans R.

|NA |NA |NA | | Station | Parameter | Unit | |EST1 | P1 |M | |NA | P2 |KM | |NA | P3 |MM | |EST2 | P1 |M | |NA | P2 |KM | |NA | P3 |MM | |EST3 | P1 |M | |NA | P2 |KM | |NA | P3 |MM | |NA |NA |NA |

code pour reproduire le tableau:

a= c(NA, 'Station', 'EST1', NA, NA, "EST2", NA, NA, "EST3", NA, NA, NA)

b= c(NA, 'Parameter', 'P1', 'P2', 'P3', 'P1', 'P2', 'P3','P1','P2','P3', NA)

c= c(NA, 'Unit', 'M', 'KM', 'MM','M', 'KM', 'MM','M', 'KM', 'MM', NA)

data =(data.frame(a,b,c))

rafa.pereira

Cela fera peut-être l'affaire, en supposant que la Parametercolonne n'en a pas NAs.

library(magrittr)

# find start and ending row of the table
starting_row <- row(data)[which(data$a == "Station"), ][1]
ending_row <- row(data)[which(is.na(data$b)), ][,1] %>% max() -1


# slice the data
table1 <- data[ starting_row:ending_row, ]

table1
>         a         b    c
> 2  Station Parameter Unit
> 3     EST1        P1    M
> 4     <NA>        P2   KM
> 5     <NA>        P3   MM
> 6     EST2        P1    M
> 7     <NA>        P2   KM
> 8     <NA>        P3   MM
> 9     EST3        P1    M
> 10    <NA>        P2   KM
> 11    <NA>        P3   MM

Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.

En caso de infracción, por favor [email protected] Eliminar

Editado en2021-01-21

Déjame decir algunas palabras

0Comentarios

Iniciar sesiónRevisión de participación posterior

Anterior:Filtrar matriz anidada de objetos a matriz de objetos

TOP Lista

Artículos

Extraire un tableau d'une feuille de calcul sous une certaine condition

Extraire un tableau d'une feuille de calcul sous une certaine condition

¿Cómo ocultar la aplicación web de los robots de búsqueda? (ASP.NET)

Pandas의 CSV 파일을 Pandas 데이터 프레임으로 가져 오기

uitableview delete button image in iOS

Manera correcta de agregar referencias al proyecto C # de modo que sean compatibles con el control de versiones

Swift / Firebase : Facebook 사용자가 계정을 만들 때 Firebase 데이터베이스에 제대로 저장하려면 어떻게해야합니까?

caída condicional de filas desde un marco de datos de pandas

Link library in Visual Studio, why two different ways?

Pagination class not getting applied in html

Que signifie Decimal (-1)?

UIButton textLabel with different fonts

WPF pleine largeur DataGridColumn sur la largeur de DataGrid

Opción de máquina virtual no reconocida 'MaxPermSize = 512m' cuando se ejecuta Zeppelin

matplotlib로 그래프를 그리는 동안 커서 위치에서 날짜 / 시간을 볼 수 없습니다. "DateFormatter에서 x = 0 값을 찾았습니다"라는 오류가 발생합니다.

¿Es posible en Windows evitar que otras aplicaciones se enganchen en las DLL del sistema?

Error de la base de datos de Android Firebase: Permiso denegado al depurar en un teléfono

Pandas: suma filas de DataFrame para columnas dadas

ggplot2: gráfico con líneas y puntos para problemas de leyenda de dos conjuntos de datos

¿Cómo especificar el puerto en el que se aloja una aplicación ASP.NET Core?

Recherche de la position d'index d'une valeur dans r dataframe

GPU를 사용하여 ffmpeg 필터의 처리 속도를 가속화하는 방법은 무엇입니까?

nested observables executed one after the other after termination