Pessoal, estou com um desafio aqui num deadline curto, não sei se conseguem me ajudar.
Preciso raspar esse site aqui: https://splegisconsulta.camara.sp.gov.br/Pesquisa/IndexProjeto
O que eu preciso: dos projetos de lei que foram PROMULGADOS entre 2001 e 2020.
O mecanismo de busca do site só permite buscas de 5 em 5 anos.
O meu ídolo Julio Trecenti já fez uma parte do código: https://gist.github.com/jtrecenti/c7188dd43d0bdf0208b168b03d7e6894
Acho que pro que eu preciso os critérios de consulta seriam os seguintes:
Sigla do Projeto: PL
Número / Ano: Só o campo do ano
Somente projetos promulgados: TRUE
bd <- list(
COD_MTRA_LEGL = “PL”,
FILTRO_COD_PCSS_CMSP_INI = “”,
FILTRO_ANO_PCSS_CMSP_INI = “2001”,
FILTRO_COD_PCSS_CMSP_FIM = “”,
FILTRO_ANO_PCSS_CMSP_FIM = “2005”,
LDRE_COD = “=”,
LDRE_NRO = “”,
LDRE_ANO = “”,
**DT_LEIT_INI = “”, **
DT_LEIT_FIM = “”,
TRAMIT_ONLY = “false”,
PROMUL_ONLY = “TRUE”,
COD_TIPO_MOTIVO_TRAMITACAO = “”,
TXT_OBSERVACAO_TRAMITACAO = “”,
COD_TIPO_VETO = “”,
VOTACAO = “”
)
O resultado da busca tem os seguintes campos:
Projeto
Emenda
Norma
Palavras-chaves
Promoventes
O problema é que são muitas páginas de resultados. E sou um zero à esquerda quando o assunto é scraping rs.
Alguém saberia como me ajudar, por gentileza?