Home » Análisis básico

Análisis básico

EMBOSS

Usaremos diferentes programas del paquete de software EMBOSS.


Programas de EMBOSS

Ejercicio

  1. Utilizando extractseq, haga el splicing del gen de la rodopsina de Xenopus y extraiga la CDS completa.
  2. Use sixpack para traducir a proteína la CDS obtenida y confirmar que el splicing ha sido correcto.

Análisis composicional

Ya hemos visto en el tema anterior como se determina la longitud y el contenido global en G+C (%GC) de una secuencia (infoseq).

También es interesante determinar la variación espacial del %GC a lo largo de una secuencia (freak).

La composición de una secuencia de ADN se puede estudiar determinando las frecuencias de mononucleótidos, dinucleótidos, etc

Para ello se usa una ventana movil que se va desplazando posición a posición a lo largo de la secuencia (compseq). Por ejemplo, para determinar la frecuencia de dinucleótidos se usa una ventana de tamaño 2 y salto de 1:

ATTCCGTGAACTG…

AT, TT, TC, CG, GT…


Uso de codones

Es importante subrayar que los codones no se cuentan cómo los trinucleótidos. Estos últimos se cuentan mediante compseq con una ventana solapante. Los codones son también trinucléotidos, pero NO solapantes. Otra cuestión a tener en cuenta es que los codones hay que contarlos en la fase correcta. El recuento de codones hay que hacerlo pues con el programa cusp. El uso de codones (o dialecto genético) es especie-específico en organismos unicelulares y región-específico en multicelulares.

Patrones en el ADN

Existen varias utilidades de EMBOSS para el descubrimiento de patrones (o motivos), tanto en el ADN (fuzznuc) como en las proteínas (fuzzpro, antigenic).

Una manera visualizar estos patrones es mediante el llamado ‘juego del caos’. El programa de EMBOSS que permite obtener una representación caótica de una secuencia de ADN es chaos. Puede usar la secuencia de la región de la beta-globina humana para obtener su representación caótica, y compararla con la imagen que se obtiene tras aleatorizar la secuencia mediante suffleseq.


Mapas de restricción

El programa ‘restrict‘ permite obtener un listado de las dianas que presenta una secuencia problema de ADN para distintas enzimas de restricción. Se pueden especificar una o dos enzimas de restricción, o bien todas las enzimas de REBASE. Existen opciones para controlar los sitios que se quieren obtener y para elegir el formato de salida.

Anuncios

Fecha de entrega del trabajo personal extendido al 5 de marzo

Comienzo de las clases: 4 de febrero, 12h

Aula-Inf O01 (Decanato)

—————————

Para un mayor aprovechamiento de la asignatura, se recomienda acudir a clase con ordenador portatil o tableta.