Bom dia, tenho o boxplot abaixo, onde o eixo X é o ano/mês que ocorreu a compra e o eixo y é o valor da compra.
Eu gostaria de saber a quantidade de observações que tem por quartil, por exemplo, quantos clientes compraram entre R$ 40 e R$ 55 (que é a caixa do 1º boxplot, por exemplo).
Eu gostaria de fazer uma tabela parecida com esta por quartil
Athos
Junho 29, 2021, 12:06pm
2
Pensei em algo tipo assim:
library(tidyverse)
df <- tibble(
`Ano/Mês` = rep(c(202003, 202004), c(5000, 3000)),
Valor = round(rgamma(length(`Ano/Mês`), shape = `Ano/Mês`*40/202003))
)
ggplot(df) +
geom_boxplot(aes(x = factor(`Ano/Mês`), y = Valor), fill = "plum")
df %>%
group_by(`Ano/Mês`) %>%
mutate(
quantis = cut_number(Valor, 4, labels = c("Q1", "Q2", "Q3", "Q4"))
) %>%
group_by(`Ano/Mês`, quantis) %>%
summarise(
`Qtd de observações` = n(),
`Vlr Min` = min(Valor),
`Vlr Max` = max(Valor)
)
#> `summarise()` has grouped output by 'Ano/Mês'. You can override using the `.groups` argument.
#> # A tibble: 8 x 5
#> # Groups: Ano/Mês [2]
#> `Ano/Mês` quantis `Qtd de observações` `Vlr Min` `Vlr Max`
#> <dbl> <fct> <int> <dbl> <dbl>
#> 1 202003 Q1 1507 22 36
#> 2 202003 Q2 1261 37 40
#> 3 202003 Q3 1100 41 44
#> 4 202003 Q4 1132 45 68
#> 5 202004 Q1 755 21 35
#> 6 202004 Q2 745 36 39
#> 7 202004 Q3 823 40 44
#> 8 202004 Q4 677 45 68
1 curtida