Predicción de islas
Región de interés: chr1:889,454-928,416 (Ensamblado hg19)
Métodos de ventanas deslizantes: CpGplot y Newcpgreport (EMBOSS)
Mediante el programa CpGplot podemos tanto detectar las islas como visualizar el porcentaje G+C y la proporción observados/esperados (frecuencia de CpG observada/frecuencia de CpG esperada) a lo largo de la secuencia.
- Introducir la secuencia de ejemplo en el programa y realizar la predicción con los parámetros por defecto.
- Aumentar el tamaño de la ventana, ¿cómo cambia la predicción?
- Si cambiamos los umbrales de G+C y O/E, ¿qué efecto tienen en el tamaño de las islas predichas?
- CpGplot, nos facilita las coordenadas relativas de las islas CpG pero no calcula las propiedades de la secuencia (G+C, O/E). Para ello, extraeremos las secuencias correspondientes a las islas CpG mediante el programa extractseq y calcularemos la composición mediante el programa compseq.
- Repetir la predicción con el programa newcpgreport para comprobar los valores composicionales de las islas.
Cuestiones:
- Cuantas islas existen utilizando los parámetros definidos por Gardiner-Garden & Frommer 1987 (length ≥ 200 bp, ObsCpG/ExpCpG ≥ 0.6, and %GC ≥ 50%).
- Cuantas islas existen utilizando los parámetros definidos por Takai & Jones 2002 (length ≥ 500 bp, ObsCpG/ExpCpG ≥ 0.65, and %GC ≥ 55%).
- Realizar el proceso de predicción de islas para la secuencia anónima.
Métodos de clusterización: CpGcluster
- El programa CpGcluster se basa en otro método (clusterización de dinucleótidos CpG) para predecir islas. Podemos usar tanto el repositorio para determinar las islas CpG como la secuencia para predecirlas.
- Para ello, seleccionamos en el software el ensamblado y cromosoma al que corresponde nuestra secuencia anónima. De las islas obtenidas, seleccionamos las que correspondan a nuestra secuencia.
- Acceder las predicciones mediante NGSmethDB. Podemos usar el ‘Table Browser’ –> Group: ‘CpG islands’; track: ‘CGIs strict set’
Cuestiones:
- ¿Qué diferencias observamos en la predicción de islas entre los métodos de ventanas y el de clusterización?
Análisis de metilación
- Visualizaremos los niveles de metilación de la región chr1:889,454-928,416 (Ensamblado hg19) mediante los Track Hubs de la base de datos NGSmethDB.
- ¿Qué observamos?
- ¿Qué relación hay entre los niveles de metilación y la predicción de las islas?
- ¿En qué regiones génicas se ubican las zonas no-metiladas?
- ¿Hay alguna región con metilación diferencial?