Iteração de várias páginas html salvas

Olá, fiz a raspagem de várias páginas salvas assim: pasta/ano/ano_mes_pag[n].html (ex.: output/2014/2014_09_pag1.html. Por meio do código: arquivos = list.files(pattern = paste0(ano,"_", mes), recursive = TRUE), criei um objeto com todos os arquivos de um determinado ano/mês. Cada página seguinte é continuação da anterior (uma tabela com nomes de A a Z).

Caso eu tente carregar individualmente, o seguinte código dá certo: temp_table ← readHTMLTable(doc = “output/2014/2014_9_pag1.html”)[[12]]. No entanto, estou com dificuldade para conseguir fazer uma iteração que abra todas as páginas html de um determinado ano/mês (que está salva no objeto “arquivos”) e adicione o conteúdo a um mesmo data frame.

Alguém pode dar uma luz? Pensei em usar map_dfr, mas não tem funcionado.

Enio,

Sem ver os dados ou a página à qual você se refere, é difícil ter certeza de que o código abaixo vai funcionar. Minha sugestão é criar uma função que receba o nome do arquivo e retorne o data frame arrumado:

# Listar todos os arquivos
arquivos <- list.files(pattern = paste0(ano,"_", mes), recursive = TRUE, full.names = TRUE)

# Função para ler 1 arquivo
ler_tabela <- function(arquivo) {
  readHTMLTable(doc = arquivo)[[12]]
}

# Iterar e empilhar
purrr::map_dfr(arquivos, ler_tabela)