根据r中另一列的观测值创建新列

啤酒王

我在此专栏中有一个名为“ encuesta”的df

Orientación prioritaria
<chr>
Gastroenterología clinica;Endoscopia digestiva;Motilidad y Neurogastro
Gastroenterología clinica;Endoscopia digestiva;Motilidad y Neurogastro
Gastroenterología clinica;Endoscopia digestiva;Motilidad y Neurogastro
Gastroenterología clinica;Endoscopia digestiva
Motilidad y Neurogastro
Gastroenterología clinica;Motilidad y Neurogastro

我想根据以“;”分隔的值创建新列在每一行

我已经尝试过这样的事情，例如：

encuesta$`Gastroenterología clínica` <- encuesta$`Orientación prioritaria` %in% str_detect(encuesta$`Orientación prioritaria`, regex("Gastroenterología"))

它创建了一个新列，Gastroenterología clínica但它对所有观察结果进行了评估，得出FALSE，我不明白为什么。

鸭

separate()在tidyr（tidyverse）中尝试这种方法：

library(tidyverse)
#Separate
df2 <- df %>% separate(col = V1,into = c('a','b','c'),sep = ';')

输出：

                          a                       b                       c
1 Gastroenterología clinica    Endoscopia digestiva Motilidad y Neurogastro
2 Gastroenterología clinica    Endoscopia digestiva Motilidad y Neurogastro
3 Gastroenterología clinica    Endoscopia digestiva Motilidad y Neurogastro
4 Gastroenterología clinica    Endoscopia digestiva                    <NA>
5   Motilidad y Neurogastro                    <NA>                    <NA>
6 Gastroenterología clinica Motilidad y Neurogastro                    <NA>

使用了一些数据：

#Data
df <- structure(list(V1 = c("Gastroenterología clinica;Endoscopia digestiva;Motilidad y Neurogastro", 
"Gastroenterología clinica;Endoscopia digestiva;Motilidad y Neurogastro", 
"Gastroenterología clinica;Endoscopia digestiva;Motilidad y Neurogastro", 
"Gastroenterología clinica;Endoscopia digestiva", "Motilidad y Neurogastro", 
"Gastroenterología clinica;Motilidad y Neurogastro")), class = "data.frame", row.names = c(NA, 
-6L))

更新：为了使每个值一个变量在此处，代码：

#Code
df %>% separate_rows(V1,sep=';') %>%
  mutate(V=paste0('V',1:n())) %>%
  pivot_wider(names_from = V,values_from=V1)

输出：

# A tibble: 1 x 14
  V1      V2     V3      V4      V5    V6     V7     V8    V9     V10    V11   V12    V13    V14   
  <chr>   <chr>  <chr>   <chr>   <chr> <chr>  <chr>  <chr> <chr>  <chr>  <chr> <chr>  <chr>  <chr> 
1 Gastro~ Endos~ Motili~ Gastro~ Endo~ Motil~ Gastr~ Endo~ Motil~ Gastr~ Endo~ Motil~ Gastr~ Motil~

更新2：为了每个类都有一个变量，请尝试以下操作：

#Code 2
df %>% mutate(id=1:n()) %>% separate_rows(V1,sep=';') %>%
  #group_by(V1) %>%
  mutate(var=1) %>%
  pivot_wider(names_from = V1,values_from=var) %>%
  replace(is.na(.),0) %>% select(-id)

输出：

# A tibble: 6 x 3
  `Gastroenterología clinica` `Endoscopia digestiva` `Motilidad y Neurogastro`
                        <dbl>                  <dbl>                     <dbl>
1                           1                      1                         1
2                           1                      1                         1
3                           1                      1                         1
4                           1                      1                         0
5                           0                      0                         1
6                           1                      0                         1

如果需要总计，请尝试以下操作：

#Code 3
df %>% mutate(id=1:n()) %>% separate_rows(V1,sep=';') %>%
  #group_by(V1) %>%
  mutate(var=1) %>%
  pivot_wider(names_from = V1,values_from=var) %>% select(-id) %>%
  summarise_all(.funs = sum,na.rm=T)

输出：

# A tibble: 1 x 3
  `Gastroenterología clinica` `Endoscopia digestiva` `Motilidad y Neurogastro`
                        <dbl>                  <dbl>                     <dbl>
1                           5                      4                         5

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-25

我来说两句

0 条评论

登录后参与评论

根据r中另一列的观测值创建新列

根据r中另一列的观测值创建新列

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）