Leitura de tabela estranha

Bom dia pessoal, estou tentando manipular uma tabela com formato muito estranho no R. Ela vem como xls mas tentei abrir usando diferentes pacotes e nao vai. Abrindo na mão no excel eu vejo que ela tem estrutura txt separado por tab.

a tabela está em : http://www.ssp.sp.gov.br/transparenciassp/Consulta.aspx aí vc clica em latrocínio ( ou outro crime), escolhe um mes/ano e baixa.

Obrigado,

Bom dia Leo,

Uma sugestão é salvar o arquivo como csv e ler ele como;

library(readr)
import <- read_delim(“teste/DadosBO_2020_7(LATROCÍNIO).csv”,
“;”, escape_double = FALSE, locale = locale(encoding = “ASCII”),
trim_ws = TRUE)

2 curtidas

então, fazendo dessa forma eu consigo abrir sem problema o problema é que temos várias tabelas, salvar como csv vai demandar um tempo e eu queria entender esse bug porque tentei abrir de diferentes formas no R e nenhuma delas deu certo. fiquei curioso em entender mesmo. kkk

Leo,

Embora o arquivo se chame “.xls” você consegue abrir diretamente do R lendo como texto sem precisar abrir na mão e salvar de novo. A solução é parecida com essa do Vini, mas por padrão esse arquivo é separado por tab e tem um encoding específico e isso precisa ser definido dentro do read.delim.

Acho que o comando abaixo vai fazer o que você quer, pois me lembro de ter usado isso quando mexi nesses dados.

read.delim(x, fileEncoding = "UTF-16LE", sep = "\t", header = T, stringsAsFactors = F)

Só não estou usando a solução do tidyverse porque acho mais prático passar um parâmetro de encoding diretamente.

Abs,
Fernando

3 curtidas

Oi Fernando,

esse comando funcionou perfeitamente, obrigado pelo help!

abraço,