Olá! Essa dúvida foi enviada no curso R para Ciência de Dados I.
Eu estou tentando separar uma base por quartis para ter uma melhor visão dos dados. Eu tenho duas perguntas que seguem abaixo.
1- Estou separando os dados corretamente pelos quartis? Veja por gentileza a coluna “Metodo1” do exemplo.
2- É possível criar uma coluna que terá dois comportamentos distintos para o seu preenchimento? Quando os valores da coluna “Vet” forem iguais ou inferiores a zero a coluna a ser criada será preenchida com “Negativo”. Por outro lado, quando os valores da coluna “Vet” forem superiores a zero gerarão um vetor só de valores positivos que será repartido em quartis, preenchendo essa nova coluna de acordo com a identificação do seu quartil. Em outras palavras essa nova coluna será prenchida com a identificação a quartil aquela linha faz parte se a coluna Vet for maior que zero ou preencherá simplesmente “Negativo”.
Eu fiz algumas tentativas, somente três delas estou trazendo para cá gerando as colunas de nomes “Metodo1”, Metodo2" e “Metodo3”. No arquivo em Excel, a coluna “Resultado esperado” possui justamento o resultado que eu estou buscando e a fiz na mão no excel. A questão aqui é como fazê-la no R programaticamente considerando o acima descrito. A coluna “Vet” possui o vetor que é a base desta tentativa.
Segue o código:
library(magrittr, include.only = "%>%")
library(dplyr)
Vet <- c(3.32, 2.71, -0.45 ,3.13,2.75, 3.05, -0.2, 7.85, 2.95, -1, 2.88, 2.94, -3.05, 2.88, 2.92, 2.89)
ola <- data.frame(Vet)
ola2 <- ola %>% mutate(Metodo01 = case_when(
Vet <= quantile (Vet, 0.25) ~ "1ºQ",
Vet <= quantile (Vet, 0.50) ~ "2ºQ",
Vet <= quantile (Vet, 0.75) ~ "3ºQ",
TRUE ~ "4ºQ"
),
Metodo02 = case_when(
Vet <= 0 ~"Preju",
Vet <= quantile (Vet, 0.25) ~ "1ºQ",
Vet <= quantile (Vet, 0.50) ~ "2ºQ",
Vet <= quantile (Vet, 0.75) ~ "3ºQ",
TRUE ~ "4ºQ"
),
Metodo03 = case_when(
Vet <= 0 ~"Preju",
Vet <= quantile (Vet > 0, 0.25) ~ "1ºQ",
Vet <= quantile (Vet > 0, 0.50) ~ "2ºQ",
Vet <= quantile (Vet > 0, 0.75) ~ "3ºQ",
TRUE ~ "4ºQ"
)
)
Segue uma planilha eletrônica contendo um quadro comparativo dessas tentativas.
Se a pergunta for a válida para o discourse pode levá-la para lá.
Muito obrigado.
Tabela enviada: https://docs.google.com/spreadsheets/d/1lyMoz-IY4zWvOaxwATP4yXmpy_RApN8ENJj_50U_Kdk/edit?usp=sharing