Oi pessoal! Tenho uns dados contendo ID e para respectiva ID um texto, são 2373 textos no total. Estou tentando obter as palavras chaves para cada texto, utilizando o textrank. No R tem um pacote implementado que possui o mesmo nome, e a função que pretendo utilizar é a textrank_keywords.
Meu data.frame tem a seguinte estrutura:
ID,texto,palavra
Na coluna palavra, tenho cada palavra contida em cada texto… Através da função unnest_tokens()
A questão é que a função (textrank_keywords), não se fixa em cada ID… Ela acaba gerando as keywords considerando todos os textos juntos…
Teria alguma maneira de eu conseguir que a função considerasse cada ID? Tentei fazer um loop mas não avancei muito…
A ideia seria ter o seguinte resultado, ou ao menos parecido…
ID,keyword
Oi Athos, na planilha abaixo tenho um exemplo do banco de dados inicial, antes de aplicar o unnest_tokens e separar palavra por palavra de cada texto… com a respectiva ID e o texto de cada ID…
Os textos já passaram por algum tratamento… retirada de stopwords, todo o texto em minuscula e retirada de acentuação, números, espaços extras.
Obrigado @Athos!!
Só mais uma dúvida…
Teria alguma maneira de eu retirar apenas um elemento de dentro dessa lista?
Exemplo: Pegar apenas o $keywords da lista keywords