Dúvida em como criar dataset dentro de um pacote

lailaviana · Setembro 18, 2023, 7:19pm

Boa tarde pessoal,

Estou criando um pacote que inicialmente lê um arquivo do tipo fasta, que é muito comum na área de biologia, que começa com uma descrição de uma única linha, seguida pela sequência. Vou dar um exemplo abaixo:

">"seq1 (descrição)
ATATGCTA (sequência)
">"seq2 (descrição)
ATGGACT (sequência)
e assim por diante.

Entretanto, estou sem saber como devo disponibilizar esse dataset (tipo o exemplo que forneci) para o meu pacote sem que ele seja “lido”, uma vez que a função que lê ele (Biostrings::readAAStringSet()) já está dentro de uma função do meu pacote.

Segue um exemplo reduzido da minha função:

get_alignment_score ← function(fasta, type, alignment_method) {

myseq ← Biostrings::readAAStringSet(fasta)
…
…
…
}

A dúvida é, como devo subir esse meu arquivo chamado fasta na minha pasta data/?
Já tentei colocar ele de diversas formas e dá erro ao executar o devtools::check():

❯ checking examples … ERROR
Running examples in ‘dgfr-Ex.R’ failed
The error most likely occurred in:

base::assign(“.ptime”, proc.time(), pos = “CheckExEnv”)

Name: get_alignment_score

Title: Function to perform pairwise alignment of all sequences and

retrieve the alignment score

Aliases: get_alignment_score

** Examples

get_alignment_score(fasta, “prot”, “global”)
[1/5] Loading substitution matrix…
[2/5] Loading fasta file…
Error in .Call2(“new_input_filexp”, filepath, PACKAGE = “XVector”) :
cannot open file ‘data-raw/tcmuc_100_prot.fasta’
Calls: get_alignment_score … lapply → lapply → FUN → new_input_filexp → .Call2
Execution halted

Obrigada