Webscraping: Status code 303 -> Help

Pessoal,

estou tentando um webscraping de uma página (u = ‘Buscar | Secretaria de Estado de Saúde de Minas Gerais’) simulando uma busca simples (query = list(‘all’=Dengue))

r ← httr::GET(url = u, path = “component/search/”, query = query)

E recebo isto. Alguém teria uma ideia de como retornar o querido status code 200?

Response [Buscar | Secretaria de Estado de Saúde de Minas Gerais]
Date: 2021-11-26 21:08
Status: 303
Content-Type: text/html; charset=utf-8

Opa Denis, tudo bem? Eu não sou um grande especialista (estava na sua turma de Webscraping), mas testando aqui, eu coloquei o user_agent e ele funcionou. E um ponto a mais, a query precisa incluir o “area”=“all” também, se tu pesquisar apenas “Buscar | Secretaria de Estado de Saúde de Minas Gerais” ele retorna " 0 resultado(s) de busca para “dengue”".

Obs: esse é o meu user_agent, acredito que o seu seja diferente. Acha-se lá no f12 na parte de Request Headers. Espero que ajude!

segue o código:

u_base ← “Buscar | Secretaria de Estado de Saúde de Minas Gerais

user_agent ← “Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36”

r ← httr::GET(u_base,
query = list(
“all”=“dengue”,
“area”=“all”
),
httr::user_agent(user_agent),
httr::write_disk(“exemplo.html”, overwrite = TRUE))

Fala Douglas. Rapaz, eu cheguei a colocar as queries (incluindo o user_agent) dentro da lista na query, sabe? Ae tb não rolou. Mas tentei dessa maneira que citou e deu certo!!!

Sim, você tinha razão sobre o ‘all’. No código original ele está preenchido.

Como que você sacou essa cara?

Valeu mesmo!!!

1 curtida