Hemos visto cómo buscar secuencias mediante palabras clave. Pero en Bioinformática es más frecuente tener como dato de partida una secuencia parcial sin anotar, es decir una secuencia anónima. En este caso se hace necesario hacer un ‘rastreo’ de toda la base de datos de secuencias conocidas. Para ello es necesario alinear nuestra secuencia problema con todas y cada una de las secuencias que hay en la base de datos. Esto se consigue mediante los algoritmos de alineamiento local: FASTA y BLAST. Veamos como se usan estos programas.
FASTA | EBI, Cambridge |
BLASTn (DNA) | NCBI, USA |
BLASTp (proteínas) | NCBI, USA |
Análisis de una secuencia anónima (sequence) mediante BLAST
Preguntas:
- ¿De gen se trata y a que especie pertenece?
- ¿Este gen tiene homólogos en otras especies?
- ¿Este gen tiene variación transcripcional y diferentes isoformas a nivel de proteína?
Buscar información del gen en NCBI gene
Preguntas:
- ¿Qué es la función de este gen?
- ¿Cuantas isoformas tiene?
Secuencia anónima 1: Secuencia anónima
Secuencia anónima de proteína:
MEEDRNWIVV PTWRVPGRME KWHALVKYLK YRTKDLEEVR YVPHHKVGWA WWTCSRVIFP
LQGKSHLEIQ AYWNLTPEKG WLSSHAVRLT WYTEKFWTDV TPDCADILIH STYFSCFTAG
EVRRAIRGEK LLSCCNYPQA HKAQVPSLQY LALVVVQQND RPQ
Generar un alineamiento local usando el algoritmo de Smith-Waterman
Secuencias: NP_009231.2 y NP_009225.1
Preguntas
- ¿A que corresponde el hueco en el alineamiento?
Búsqueda de una secuencia (sec29) en el genoma: BLAT
Preguntas:
- ¿A que cromosoma y coordenadas corresponde esta secuencia?
- ¿Qué gen contiene la secuencia?
- ¿Qué función tiene este gen, y/o a que enfermedad(es) está asociado?