Olá nobres baixadores de dados de tribunais.
Estou tentando baixar dados da Pesquisa de jurisprudência (tst.jus.br)
É um formulário para pesquisa:
Ele retorna uma Requisição Post que um Body Cheio de { }, que não se refere a nada; colchetes vazios [ ]; e até mesmo umas " " que dão um problema na hora de colocar como parâmetro no R
Inicialmente deu erro 405, mas tirei o HTTPS e coloquei HTTP e voltou um 200, mas de 4kb, que nao tinha nenhuma informação.
Acho que o problema está no primeiro item do body: que não tem nome e tá cheio de coisa estranha:
{ou: null, e: ““juízes classistas””, termoExato: “”, naoContem: null, ementa: null, dispositivo: null,…}
Ao fazer codigo, coloquei vários " para que o R entendesse que não é mais de um character. Seria esse o problema?
#Scrapper TST
#Autor: Marcello Filgueiras
# Baixando Dados ----------------------------------------------------------
library(tidyverse)
library(rvest)
library(httr)
library(xml2)
url_base <- "http://jurisprudencia.tst.jus.br/"
parametros <- list("{'ou: null, e: \"\\\"juízes classistas\"\\\", termoExato: \"\", naoContem: null, ementa: null, dispositivo: null,…}",
"classesProcessuais" = "[]",
"convocados" = "[]",
"dispositivo" = "null",
"e" = "\"juízes classistas\"",
"ementa" = "null",
"indicadores" = "[]",
"ministros" = "[]",
"naoContem" = "null",
"numeracaoUnica" = "{numero: null, digito: null, ano: null, orgao: \"5\", tribunal: null, vara: null}",
"orgao" = "TST",
"orgaosJudicantes" = "[]",
"ou" = "null",
"termoExato" = "",
"tipos" = "[\"ACORDAO\"]",
"tiposDecisoes" = "[]"
)
a<- httr::POST(url_base, parametros)
content(a)
read_html(a)
Enfim, até dá o retorno 200, mas de 4kb sem nenhum resultado. Imaginam qual seria o problema? esse parâmetro doido não me deixou como fazer. Se puderem ajudar, ficaria grato. =D