GGPLOT - Geom_Boxplot - Tratamento de Outliers

COMO ESCREVER UMA BOA PERGUNTA

Bom dia galera, tudo bem?

Estou tentando fazer um boxplot de uma tabela com 3M linhas.

Básicamente essa tabela tem:

image

Executei o script abaixo:

library(tidyverse)

bd ← data.table::fread(“C:/Users/jrochadesouz/Downloads/stock_sku.csv”) %>%
as_tibble()

bd %>%
ggplot(aes(x = WAREHOUSE_ID , y = total_qty)) +
geom_boxplot(outlier.stroke = T)

O resultado foi o gráfico de boxplot com muitos outliers e quase e não deu para entender a distribuição dos dados:

Alguém passou por esse problema? Como resolveu?

Desde já agradecido pelos feedbaks.

atenciosamente,

Joel Rocha.

me parece que um geom_boxplot(outlier.stroke = T) + scale_y_log10() vai melhorar a visualização!! Mas vai transformar em escala log.

1 curtida