Recolección de datos

Como hemos visto, para un alineamiento múltiple se necesitan tres o más secuencias de ADN o proteínas en formato multi-fasta.

Hay dos posibilidades para recolectar estas secuencias:

1. A partir de una secuencia anónima:

MVKPIIAPSI LASDFANLGC ECHKVINAGA DWLHIDVMDG HFVPNITLGQ PIVTSLRRSV
PRPGDASNTE KKPTAFFDCH MMVENPEKWV DDFAKCGADQ FTFHYEATQD PLHLVKLIKS
KGIKAACAIK PGTSVDVLFE LAPHLDMALV MTVEPGFGGQ KFMEDMMPKV ETLRAKFPHL
NIQVDGGLGK ETIPKAAKAG ANVIVAGTSV FTAADPHDVI SFMKEEVSKE LRSRDLLD

En este caso se usa FASTA para obtener las secuencias más relacionadas con esta secuencia problema. Marcaremos aquellas secuencias en las que estemos interesados:

 sshot-2

Al pulsar sobre el boton ‘Download’ obtendremos nuestras secuencias en formato multi-fasta:

sshot-3

Copiando/pegando este multifasta en el Bloc de Notas, por ejemplo, podremos editar este archivo para poner el nombre adecuado a cada secuencia.

2. A partir del nombre de una proteína: rpe, rpoB, p53, etc.
En este caso, utilizaremos una búsqueda con PubMed – Protein:
sshot-4
A partir de aquí, el proceso es similar al anterior. Se marcan las secuencias que nos interesen, se elige el formato FASTA en ‘Display Settings’, y con el botón ‘Send to’ se crea un archivo multi-fasta con las secuencias.