Sesión 4

Curso: R Aplicado a los Proyectos de Investigación

Percy Soto-Becerra, M.D., M.Sc(c)

InkaStats Data Science Solutions | Medical Branch

2022-10-10

https://github.com/psotob91

Manejo de datos 2: Categorización y etiquetado de variables

Agenda

Manejo de datos 2: Categorización y etiquetado de variables
AID / AED en R

Creación de variables con case_when()

Función de apoyo a mutate()para crear variables según condiciones más complejas.
Crea variables de acuerdo a condiciones complejas

case_when(
  condición1 ~ resultado1, 
  condición2 ~ resultado2, 
  condición3 ~ resultado3
  )

Toda transformación o creación de variables en dplyr ocurre por mutate; por tanto, case_when()se utiliza dentro de un mutate

datos %>% 
  mutate(
    nueva_var = case_when(
      condición1 ~ resultado1,
      condición2 ~ resultado2, 
      condición3 ~ resultado3
    )
  )

Atajo de teclado para obtener ~: Alt + 1 + 2 + 6

Argumento	Descripción
.data	Data frame o extensión de data frame (por ejemplo, tibble).
...	variable = 'nueva etiqueta'

AID / AED en R

Agenda

Manejo de datos 2: Categorización y etiquetado de variables
AID / AED en R

Data summary
Name	datos
Number of rows	3
Number of columns	3
_______________________
Column type frequency:
numeric	3
________________________
Group variables	None

skim_variable	complete_rate	mean	sd	p0	p25	p50	p75	p100	hist
pas	1	121.53	20.96	100.20	111.25	122.3	132.20	142.10	▇▁▇▁▇
pad	1	78.00	3.61	74.00	76.50	79.0	80.00	81.00	▇▁▁▇▇
pam	1	92.51	7.93	86.06	88.08	90.1	95.74	101.37	▇▇▁▁▇

Data summary
Name	datos
Number of rows	23
Number of columns	13
_______________________
Column type frequency:
character	2
numeric	11
________________________
Group variables	None

skim_variable	n_missing	complete_rate	min	max	empty	n_unique	whitespace
tratamiento	0	1	4	25	0	5	0
protocolo	0	1	3	7	0	3	0

skim_variable	n_missing	complete_rate	mean	sd	p0	p25	p50	p75	p100	hist
id_jaula	0	1.00	5.30	3.38	1.00	2.00	5.00	9.00	10.00	▇▃▅▂▇
id_raton	0	1.00	12.00	6.78	1.00	6.50	12.00	17.50	23.00	▇▆▇▆▇
peso_inicial	0	1.00	23.68	1.99	18.90	22.59	23.50	24.90	27.90	▂▃▇▇▂
peso_final	0	1.00	28.59	2.18	23.80	27.08	28.77	30.10	33.28	▂▆▇▅▂
peso_utero	0	1.00	0.09	0.10	0.01	0.06	0.07	0.09	0.54	▇▁▁▁▁
chol	0	1.00	81.96	12.89	59.28	72.31	82.08	87.29	107.49	▅▃▇▃▃
glucose	0	1.00	124.74	37.27	60.10	99.08	118.37	147.50	195.53	▅▇▇▃▅
tag	0	1.00	153.06	52.36	90.99	108.13	141.10	190.11	282.64	▇▃▅▁▂
prot	11	0.52	5.22	0.49	4.68	4.91	5.08	5.34	6.17	▇▃▅▁▃
urea	9	0.61	56.95	32.34	26.02	38.87	48.16	64.80	157.89	▇▃▁▁▁
album	12	0.48	66.15	8.44	52.77	62.12	66.82	69.62	83.73	▃▃▇▂▂

Data summary
Name	datos
Number of rows	23
Number of columns	13
_______________________
Column type frequency:
character	2
numeric	11
________________________
Group variables	None

skim_variable	n_missing	complete_rate	min	max	empty	n_unique	whitespace
tratamiento	0	1	4	25	0	5	0
protocolo	0	1	3	7	0	3	0

skim_variable	n_missing	complete_rate	mean	sd	p0	p25	p50	p75	p100	hist
id_jaula	0	1.00	5.30	3.38	1.00	2.00	5.00	9.00	10.00	▇▃▅▂▇
id_raton	0	1.00	12.00	6.78	1.00	6.50	12.00	17.50	23.00	▇▆▇▆▇
peso_inicial	0	1.00	23.68	1.99	18.90	22.59	23.50	24.90	27.90	▂▃▇▇▂
peso_final	0	1.00	28.59	2.18	23.80	27.08	28.77	30.10	33.28	▂▆▇▅▂
peso_utero	0	1.00	0.09	0.10	0.01	0.06	0.07	0.09	0.54	▇▁▁▁▁
chol	0	1.00	81.96	12.89	59.28	72.31	82.08	87.29	107.49	▅▃▇▃▃
glucose	0	1.00	124.74	37.27	60.10	99.08	118.37	147.50	195.53	▅▇▇▃▅
tag	0	1.00	153.06	52.36	90.99	108.13	141.10	190.11	282.64	▇▃▅▁▂
prot	11	0.52	5.22	0.49	4.68	4.91	5.08	5.34	6.17	▇▃▅▁▃
urea	9	0.61	56.95	32.34	26.02	38.87	48.16	64.80	157.89	▇▃▁▁▁
album	12	0.48	66.15	8.44	52.77	62.12	66.82	69.62	83.73	▃▃▇▂▂

1 / 21

Sesión 4 Curso: R Aplicado a los Proyectos de Investigación Percy Soto-Becerra, M.D., M.Sc(c) InkaStats Data Science Solutions | Medical Branch 2022-10-10 https://github.com/psotob91

Sesión 4
Manejo de datos 2: Categorización y etiquetado de variables
Creación de variables con case_when()
Condición no cumplida en case_when()
case_when() en acción
Etiquetar variables con set_var_labels()
set_var_labels() en acción
Nuestro turno
Hagamos una pausa
AID / AED en R
Paso 1: Resumen global...
Paso 2: Detecte y...
Paso 3: Identifique...
Paso 3: Identifique...
Paso 3: Identifique...
Paso 4: Identifique...
Paso 4: Identifique...
Paso 5: Detecte y...
Nuestro turno
¡Gracias! ¿Preguntas?...
@psotob91 https://github.com/psotob91...