Predicción computacional de islas CpG

En esta actividad se proporcionarán a los alumnos las herramientas necesarias para anotar secuencias de ADN con predicciones de islas CpG. Además, se profundizará en la comprensión de los algoritmos de predicción vistos en la parte teórica y se seguirá perfeccionando el manejo del ‘UCSC Genome Browser’ (generando a partir de las predicciones obtenidas ficheros compatibles con el buscador, para finalmente visualizar los resultados junto con las anotaciones incluidas en su base de datos).


Actividades propuestas:

Región de interés: chr1:958,000-968,000 (Ensamblado hg38), dicha región puede obtener mediante la herramienta View –> DNA del buscador de UCSC.

Métodos de ventana (CpGplot)

  1. Predice las islas CpG presentes en la secuencia de ejemplo utilizando los parámetros definidos por Gardiner-Garden & Frommer 1987 (length ≥ 200 bp, ObsCpG/ExpCpG ≥ 0.6, and %GC ≥ 50%).
  2. Predice las islas CpG presentes en la secuencia de ejemplo utilizando los parámetros definidos por Takai & Jones 2002 (length ≥ 500 bp, ObsCpG/ExpCpG ≥ 0.65, and %GC ≥ 55%).

Métodos de adición (CpGreport)

  1. Calcula los ‘scores’ asignados por CpGreport a la secuencia de ejemplo.
  2. Abre el resultado en una hoja de cálculo y selecciona las regiones que cumplan los criterios establecidos por Gardiner-Garden & Frommer.

Métodos de clustering (CpGcluster)

  1. Identifica las islas predichas por CpGcluster.

Comparativa

  • Genera un fichero (BED) con las predicciones de los métodos de ventana y de adición, y compáralas con las predicciones de CpGcluster en el “UCSC Genome Browser”. Podemos subir diferentes ficheros con nuestras anotaciones propias al buscador de la UCSC, para ello deberemos generar las anotaciones en un fichero de texto con el formato definido y mediante la herramienta My Data -> Custom Tracks -> Add custom tracks podremos ir añadiéndolas una a una. Nota: si queremos representar múltiples pistas de manera simultánea deberemos incluir el cabecero de los ficheros BED.
  • Observa qué anotaciones se asocian a las islas CpG predichas (metilación de ADN, modificaciones de histonas y otros elementos reguladores).