skimr 요약에서 열에 0이 있고 다른 열에 0과 다른 값이있는 행을 선택할 수 없습니다.

DeltaIV

다음 데이터 세트가 있습니다 (실제 데이터 세트와 관련하여 단순화 됨).

foo <- structure(list(id = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 
3L), t = c(67L, 41L, 180L, 73L, 9L, 19L, 83L, 36L, 64L, 57L, 
29L, 137L, 166L, 8L, 177L, 94L, 112L, 101L, 168L, 85L, 53L, 174L, 
120L, 40L, 161L, 72L, 147L, 128L, 94L, 193L, 89L, 201L, 195L, 
13L, 248L, 122L, 120L, 44L, 270L, 134L, 146L, 237L, 105L, 176L, 
97L, 181L, 140L, 99L, 249L, 143L, 79L, 43L, 68L, 90L, 125L, 97L, 
147L, 56L, 52L, 89L, 158L, 31L, 72L, 38L, 50L, 141L, 60L, 126L, 
100L, 66L, 78L, 160L, 118L, 163L, 64L), op1 = c(0.0016, 0.0033, 
-0.0024, -0.0012, 8e-04, 0.0032, 4e-04, -4e-04, 0.0017, -0.0033, 
0.0012, -0.0011, -0.0022, -0.0034, -0.0038, -0.0021, 5e-04, 0.0012, 
-0.0043, 0.0025, 0.0021, -1e-04, -0.0024, 0, 8e-04, -7e-04, 4e-04, 
-8e-04, 0, -0.0021, 0.0017, 0.0021, -0.0026, 7e-04, 0.0048, 0.0011, 
-1e-04, 3e-04, 5e-04, 0.0026, 0.0043, 0.0027, -0.005, -0.001, 
8e-04, 3e-04, 0.0014, -0.0034, 0.0013, 1e-04, 6e-04, 0.0044, 
0.0034, -8e-04, -7e-04, 8e-04, 0.0023, -1e-04, 0.0042, 6e-04, 
-3e-04, 0.0039, -0.0014, 6e-04, 0.0012, 0.0025, 0.0011, 0.0013, 
8e-04, -3e-04, -3e-04, 0.0058, 4e-04, -0.0016, 4e-04), op2 = c(-4e-04, 
4e-04, 0, -2e-04, 1e-04, -3e-04, 5e-04, -2e-04, 2e-04, 0, -1e-04, 
0, -3e-04, 3e-04, -3e-04, 2e-04, 3e-04, 3e-04, 2e-04, 3e-04, 
-1e-04, -2e-04, 5e-04, -4e-04, 1e-04, -1e-04, -1e-04, 0, 5e-04, 
-3e-04, 5e-04, 2e-04, 4e-04, 5e-04, 1e-04, 3e-04, 4e-04, 3e-04, 
-2e-04, 1e-04, -1e-04, 4e-04, 4e-04, -4e-04, 1e-04, -2e-04, -1e-04, 
-4e-04, -4e-04, 4e-04, 4e-04, -3e-04, -2e-04, -2e-04, 2e-04, 
-5e-04, 1e-04, -2e-04, 0, 4e-04, -3e-04, 1e-04, -2e-04, 1e-04, 
-4e-04, 3e-04, 3e-04, 4e-04, -4e-04, 0, -5e-04, 2e-04, 0, 0, 
1e-04), op3 = c(100, 100, 100, 100, 100, 100, 100, 100, 100, 
100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 
100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 
100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 
100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 
100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 
100), s2 = c(642.33, 642.4, 643.58, 642.29, 642.12, 641.79, 642.66, 
642.54, 642.23, 642.13, 641.91, 642.43, 643.34, 642.56, 643.79, 
642.45, 642.66, 642.75, 642.68, 642.28, 642.61, 642.64, 642.81, 
642.24, 643, 642.48, 642.27, 641.54, 642.1, 642.13, 641.95, 642.31, 
643.24, 641.78, 643.06, 642.08, 642.01, 642.01, 643.12, 642.76, 
642.52, 643.14, 641.94, 642.32, 642.04, 642.01, 642.29, 642.04, 
643.79, 642.31, 642.31, 642.58, 642.94, 642.36, 642.82, 642.94, 
643.07, 642.73, 642.29, 642.33, 643.19, 642.33, 642.25, 641.72, 
642.51, 643.08, 641.8, 642.76, 642.29, 642.25, 642.43, 642.48, 
642.26, 643, 642.53), s6 = c(21.61, 21.61, 21.61, 21.61, 21.61, 
21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 
21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 
21.61, 21.61, 21.61, 21.61, 21.6, 21.61, 21.61, 21.61, 21.61, 
21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.6, 21.61, 
21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 
21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 
21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 
21.61, 21.61, 21.61, 21.61, 21.61, 21.61, 21.61), s10 = c(1.3, 
1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 
1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 
1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 
1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 
1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 
1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3, 1.3), s18 = c(2388L, 
2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 
2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 
2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 
2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 
2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 
2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 
2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 
2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 2388L, 
2388L, 2388L)), class = "data.frame", .Names = c("id", "t", "op1", 
"op2", "op3", "s2", "s6", "s10", "s18"), row.names = c(NA, -75L
))

표준 편차 값이 0이고 skimr::skim출력 에서 IQR (사 분위 범위)이 0이 아닌 값으로 변수를 필터링하고 싶습니다 .

# load packages
library(skimr)
library(dplyr)

# remove skim summary functions _I'm not interested in
skim_with(numeric = list(p0 = NULL, p25 = NULL, p75 = NULL, p100 = NULL, hist = NULL),
          integer = list(p0 = NULL, p25 = NULL, p75 = NULL, p100 = NULL, hist = NULL))

# define additional skim summary function iqr
skim_with(numeric = list(iqr = function(x) IQR(x, na.rm = TRUE)),
          integer = list(iqr = function(x) IQR(x, na.rm = TRUE)))

# compute summary statistics
my_stats <- skim(foo)
my_stats
# Skim summary statistics
#  n obs: 75 
#  n variables: 9 
# 
# Variable type: integer 
#  variable missing complete  n    mean    sd median iqr
#        id       0       75 75    2     0.82      2   2
#       s18       0       75 75 2388     0      2388   0
#         t       0       75 75  108.91 60.41     99  83
# 
# Variable type: numeric 
#  variable missing complete  n      mean      sd   median        iqr
#       op1       0       75 75   0.00041 0.0022  5e-04        0.0022
#       op2       0       75 75   3.5e-05 0.00029     0    5e-04     
#       op3       0       75 75 100       0         100        0     
#       s10       0       75 75   1.3     0           1.3      0     
#        s2       0       75 75 642.49    0.47      642.4      0.52  
#        s6       0       75 75  21.61    0.0016     21.61     0        

이 세 변수 (분명하다 s18, op3그리고 s10) 0 표준 편차를 가지고 있지만, 4 개 변수 ( s18, op3, s10s6) 0 IQR 있습니다. 표준 편차가 0 인 변수를 선택할 수 있습니다.

constants_according_to_sd <- filter(my_stats, stat == "sd", value == 0) 

IQR이 0이지만 표준 편차가 0이 아닌 변수를 어떻게 선택할 수 있습니까?

그레고르 토마스

데이터를 별도로 필터링하고 다음을 결합 할 수 있습니다.

filter(my_stats, stat == "sd", value > 0) %>% 
    inner_join(filter(my_stats, stat == "iqr", value == 0))

또는 필요한 열 spread을 넓게 선택한 다음 필터링 할 수 있습니다 .

library(tidyr)
my_stats %>% filter(stat %in% c("sd", "iqr")) %>% 
    select(variable, stat, value) %>%
    spread(key = stat, value = value) %>%
    filter(iqr == 0 & sd > 0)

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

다른 열에 있을 수 있는 중복 값이 있는 행 선택

Access 2016의 다른 열에서 최대 값이있는 고유 행을 어떻게 선택할 수 있습니까?

선택적이고 다른 테이블에 있는 값을 기준으로 (MySQL) 주문할 수 있습니까?

0으로 행 채우기 다른 열에는 값이 있거나 다른 열에는 값이 없습니다 python pandas에서 NaN으로 채우기

다른 열 내용 또는 열 이름에 종속 된 열을 어떻게 선택할 수 있습니까?

한 열에서는 중복되고 다른 열에서는 다른 값인 열 값이있는 행을 선택하는 방법은 무엇입니까?

한 열에 값이 0이고 다른 열에 고유 ID가있는 행에 대한 레코드를 선택하는 SQL 쿼리

값이 한 테이블의 다른 열에있는 추가 열이있는 특정 행을 선택합니다.

두 열에 다른 값이있는 SQL 선택 행

열과 행에서 다른 값을 갖고 싶습니다. 값은 반복 할 수 있지만 세 번은 할 수 없습니다.

값이 다른 행에서 역순 일 수있는 두 열에서 고유 ID를 할당합니다.

값이 간격 사이에 있으면 다른 열의 동일한 행에있는 값을 선택합니다.

동일한 값을 가진 다른 열이있는 mysql에서 행 선택

한 열에 동일한 값이 있고 다른 열에 다른 값이있는 행을 찾으십니까?

다른 열의 수가 0보다 큰 경우에만 테이블에서 열을 선택합니다.

한 열에 다른 열에 '0'이있는 값을 추가하는 방법

다른 열에 0 값이 나타나면 요인이있는 행 제거

Excel은 두 열을 비교할 때 TRUE를 반환합니다. 그러나 한 셀에는 값 0이 있고 다른 셀은 비어 있습니다.

mysql-다른 테이블에있는 다른 열의 최대 값을 기준으로 고유 한 열 선택

Excel - 다른 열에 값이 있는 첫 번째 행과 마지막 행에서 값 선택

Python의 다른 열 목록에서 열 값이 있는 행 선택

텍스트 사이에 공백이없는 문자열과 일치하지만 선행 공백 / 0이있을 수 있습니다.

다른 열에 일치하는 값이 있을 때 한 열에서 가장 큰 값을 가진 행 선택

누군가 선택에서 열의 값을 가져오고 postgres에서 다른 선택에 할당하는 방법을 설명 할 수 있습니까?

R-다른 열에 음수 값이있는 열 1의 값이있는 모든 행을 삭제합니다.

MySQL : 열에서 ID는 같지만 값이 다른 두 행을 어떻게 검색 할 수 있습니까?

Pandas에서 한 열에는 중복이 있지만 다른 열에는 다른 값이 있는 행을 어떻게 선택합니까?

R에서 행과 열이 다른 두 개의 행렬을 어떻게 추가 할 수 있습니까?

선행 0이 있는 변수를 다른 문자열과 연결

TOP 리스트

  1. 1

    Ionic 2 로더가 적시에 표시되지 않음

  2. 2

    JSoup javax.net.ssl.SSLHandshakeException : <url>과 일치하는 주체 대체 DNS 이름이 없습니다.

  3. 3

    std :: regex의 일관성없는 동작

  4. 4

    Xcode10 유효성 검사 : 이미지에 투명성이 없지만 여전히 수락되지 않습니까?

  5. 5

    java.lang.UnsatisfiedLinkError : 지정된 모듈을 찾을 수 없습니다

  6. 6

    rclone으로 원격 디렉토리의 모든 파일을 삭제하는 방법은 무엇입니까?

  7. 7

    상황에 맞는 메뉴 색상

  8. 8

    SMTPException : 전송 연결에서 데이터를 읽을 수 없음 : net_io_connectionclosed

  9. 9

    정점 셰이더에서 카메라에서 개체까지의 XY 거리

  10. 10

    Windows cmd를 통해 Anaconda 환경에서 Python 스크립트 실행

  11. 11

    다음 컨트롤이 추가되었지만 사용할 수 없습니다.

  12. 12

    C #에서 'System.DBNull'형식의 개체를 'System.String'형식으로 캐스팅 할 수 없습니다.

  13. 13

    JNDI를 사용하여 Spring Boot에서 다중 데이터 소스 구성

  14. 14

    Cassandra에서 버전이 지정된 계층의 효율적인 모델링

  15. 15

    복사 / 붙여 넣기 비활성화

  16. 16

    Android Kotlin은 다른 활동에서 함수를 호출합니다.

  17. 17

    Google Play Console에서 '예기치 않은 오류가 발생했습니다. 나중에 다시 시도해주세요. (7100000)'오류를 수정하는 방법은 무엇입니까?

  18. 18

    SQL Server-현명한 데이터 문제 받기

  19. 19

    Seaborn에서 축 제목 숨기기

  20. 20

    ArrayBufferLike의 typescript 정의의 깊은 의미

  21. 21

    Kubernetes Horizontal Pod Autoscaler (HPA) 테스트

뜨겁다태그

보관