Scraping - Aneel

Olá, pessoal!

Estou com dificuldade para conseguir fazer um web scraping desta página: https://antigo.aneel.gov.br/web/guest/central-de-informacoes-economico-financeiras?p_p_id=ciefseuser_WAR_ciefseportlet&p_p_lifecycle=0&p_p_state=normal&p_p_mode=view&p_p_col_id=column-2&p_p_col_count=1

Por exemplo, quando seleciono as empresas de distribuição (a partir da seleção ali na aba ramo), o link não altera.

O link só altera quando eu seleciono alguma empresa da lista
https://antigo.aneel.gov.br/web/guest/central-de-informacoes-economico-financeiras?p_auth=dUtrb9oN&p_p_id=ciefseuser_WAR_ciefseportlet&p_p_lifecycle=1&p_p_state=normal&p_p_mode=view&p_p_col_id=column-2&p_p_col_count=1&_ciefseuser_WAR_ciefseportlet_agenteId=7019&_ciefseuser_WAR_ciefseportlet_javax.portlet.action=visualizar

Mesmo assim, quando tentei fazer uma varredura pelos links deste site, não apareceram os links da tabela que aparece logo abaixo, na coluna “Título”.

Código

#Pacotes
library(rvest)
library(dplyr)

#Url de uma empresa como exemplo
url ← “https://antigo.aneel.gov.br/web/guest/central-de-informacoes-economico-financeiras?p_auth=dUtrb9oN&p_p_id=ciefseuser_WAR_ciefseportlet&p_p_lifecycle=1&p_p_state=normal&p_p_mode=view&p_p_col_id=column-2&p_p_col_count=1&_ciefseuser_WAR_ciefseportlet_agenteId=7019&_ciefseuser_WAR_ciefseportlet_javax.portlet.action=visualizar

#Selecionar os links da página da empresa de exemplo
lista_links ← read_html(url) %>%
html_nodes(“a”) %>%
html_attr(“href”) %>%
as_tibble()

Agradeço a atenção e tomara que não seja um exemplo de site gerado dinamicamente :pray:

Fabio,

Eu dei uma olhada rápida no site e, ao que me parece, a tabela é gerada dinamicamente sim. Talvez tenha algum modo de extraí-la com httr, mas não identifiquei nada até o momento.

Minha sugestão é tentar com o RSelenium. A documentação é um pouco longa, mas é bem explicadinha.

Vou tentar com o RSelenium!
Muito obrigado, Caio!!