Olá, fiz a raspagem de várias páginas salvas assim: pasta/ano/ano_mes_pag[n].html (ex.: output/2014/2014_09_pag1.html. Por meio do código: arquivos = list.files(pattern = paste0(ano,"_", mes), recursive = TRUE), criei um objeto com todos os arquivos de um determinado ano/mês. Cada página seguinte é continuação da anterior (uma tabela com nomes de A a Z).
Caso eu tente carregar individualmente, o seguinte código dá certo: temp_table ← readHTMLTable(doc = “output/2014/2014_9_pag1.html”)[[12]]. No entanto, estou com dificuldade para conseguir fazer uma iteração que abra todas as páginas html de um determinado ano/mês (que está salva no objeto “arquivos”) e adicione o conteúdo a um mesmo data frame.
Alguém pode dar uma luz? Pensei em usar map_dfr, mas não tem funcionado.