Boa tarde pessoal,
Estou criando um pacote que inicialmente lê um arquivo do tipo fasta, que é muito comum na área de biologia, que começa com uma descrição de uma única linha, seguida pela sequência. Vou dar um exemplo abaixo:
">"seq1 (descrição)
ATATGCTA (sequência)
">"seq2 (descrição)
ATGGACT (sequência)
e assim por diante.
Entretanto, estou sem saber como devo disponibilizar esse dataset (tipo o exemplo que forneci) para o meu pacote sem que ele seja “lido”, uma vez que a função que lê ele (Biostrings::readAAStringSet()) já está dentro de uma função do meu pacote.
Segue um exemplo reduzido da minha função:
get_alignment_score ← function(fasta, type, alignment_method) {
myseq ← Biostrings::readAAStringSet(fasta)
…
…
…
}
A dúvida é, como devo subir esse meu arquivo chamado fasta na minha pasta data/?
Já tentei colocar ele de diversas formas e dá erro ao executar o devtools::check():
❯ checking examples … ERROR
Running examples in ‘dgfr-Ex.R’ failed
The error most likely occurred in:
base::assign(“.ptime”, proc.time(), pos = “CheckExEnv”)
Name: get_alignment_score
Title: Function to perform pairwise alignment of all sequences and
retrieve the alignment score
Aliases: get_alignment_score
** Examples
get_alignment_score(fasta, “prot”, “global”)
[1/5] Loading substitution matrix…
[2/5] Loading fasta file…
Error in .Call2(“new_input_filexp”, filepath, PACKAGE = “XVector”) :
cannot open file ‘data-raw/tcmuc_100_prot.fasta’
Calls: get_alignment_score … lapply → lapply → FUN → new_input_filexp → .Call2
Execution halted
Obrigada