Bom dia pessoal, estou tentando manipular uma tabela com formato muito estranho no R. Ela vem como xls mas tentei abrir usando diferentes pacotes e nao vai. Abrindo na mão no excel eu vejo que ela tem estrutura txt separado por tab.
a tabela está em : http://www.ssp.sp.gov.br/transparenciassp/Consulta.aspx aí vc clica em latrocínio ( ou outro crime), escolhe um mes/ano e baixa.
Obrigado,
Bom dia Leo,
Uma sugestão é salvar o arquivo como csv e ler ele como;
library(readr)
import <- read_delim(“teste/DadosBO_2020_7(LATROCÍNIO).csv”,
“;”, escape_double = FALSE, locale = locale(encoding = “ASCII”),
trim_ws = TRUE)
2 curtidas
então, fazendo dessa forma eu consigo abrir sem problema o problema é que temos várias tabelas, salvar como csv vai demandar um tempo e eu queria entender esse bug porque tentei abrir de diferentes formas no R e nenhuma delas deu certo. fiquei curioso em entender mesmo. kkk
Leo,
Embora o arquivo se chame “.xls” você consegue abrir diretamente do R lendo como texto sem precisar abrir na mão e salvar de novo. A solução é parecida com essa do Vini, mas por padrão esse arquivo é separado por tab e tem um encoding específico e isso precisa ser definido dentro do read.delim
.
Acho que o comando abaixo vai fazer o que você quer, pois me lembro de ter usado isso quando mexi nesses dados.
read.delim(x, fileEncoding = "UTF-16LE", sep = "\t", header = T, stringsAsFactors = F)
Só não estou usando a solução do tidyverse
porque acho mais prático passar um parâmetro de encoding diretamente.
Abs,
Fernando
3 curtidas
Oi Fernando,
esse comando funcionou perfeitamente, obrigado pelo help!
abraço,