Home » Islas CpG y metilación

Islas CpG y metilación

Predicción de islas

Región de interés: chr1:889,454-928,416 (Ensamblado hg19)

Métodos de ventanas deslizantes: CpGplot y Newcpgreport (EMBOSS)

Mediante el programa CpGplot podemos tanto detectar las islas como visualizar el porcentaje G+C y la proporción observados/esperados (frecuencia de CpG observada/frecuencia de CpG esperada) a lo largo de la secuencia.

  1. Introducir la secuencia de ejemplo en el programa y realizar la predicción con los parámetros por defecto.
    • Aumentar el tamaño de la ventana, ¿cómo cambia la predicción?
    • Si cambiamos los umbrales de G+C y O/E, ¿qué efecto tienen en el tamaño de las islas predichas?
  2. CpGplot, nos facilita las coordenadas relativas de las islas CpG pero no calcula las propiedades de la secuencia (G+C, O/E). Para ello, extraeremos las secuencias correspondientes a las islas CpG mediante el programa extractseq y calcularemos la composición mediante el programa compseq.
  3. Repetir la predicción con el programa newcpgreport para comprobar los valores composicionales de las islas.

Cuestiones:

  1. Cuantas islas existen utilizando los parámetros definidos por Gardiner-Garden & Frommer 1987 (length ≥ 200 bp, ObsCpG/ExpCpG ≥ 0.6, and %GC ≥ 50%).
  2. Cuantas islas existen utilizando los parámetros definidos por Takai & Jones 2002 (length ≥ 500 bp, ObsCpG/ExpCpG ≥ 0.65, and %GC ≥ 55%).
  1. Realizar el proceso de predicción de islas para la secuencia anónima.

 

Métodos de clusterización: CpGcluster

  1. El programa CpGcluster se basa en otro método (clusterización de dinucleótidos CpG) para predecir islas. Podemos usar tanto el repositorio para determinar las islas CpG como la secuencia para predecirlas.
  2. Para ello, seleccionamos en el software el ensamblado y cromosoma al que corresponde nuestra secuencia anónima. De las islas obtenidas, seleccionamos las que correspondan a nuestra secuencia.
  3. Acceder las predicciones mediante NGSmethDB. Podemos usar el ‘Table Browser’ –> Group: ‘CpG islands’; track: ‘CGIs strict set’

Cuestiones:

  • ¿Qué diferencias observamos en la predicción de islas entre los métodos de ventanas y el de clusterización?

 


Análisis de metilación

  1. Visualizaremos los niveles de metilación de la región chr1:889,454-928,416 (Ensamblado hg19) mediante los Track Hubs de la base de datos NGSmethDB.
    • ¿Qué observamos?
    • ¿Qué relación hay entre los niveles de metilación y la predicción de las islas?
    • ¿En qué regiones génicas se ubican las zonas no-metiladas?
    • ¿Hay alguna región con metilación diferencial?