1. Caracterizar la secuencia del genoma humano (20 puntos)
Cada estudiante tiene asginado una secuencia anónima extraida del genoma humano. Los resultados se entregan mediante un informe breve enviando el documento a *protected email* poniendo ‘trabajo personal bioinformática’ en el asunto.
El informe ha de constar:
- Las coordenadas cromosómicas de la secuencia
- El gen que contiene:
- Descripción del gen: número isoformas (RefSeq), número de exones
- Función del gen
- Tabla con el uso de codones
- Una filogenia usando al menos 5 genes homólogos.
- Analísis composicional de la secuencia
-
- Análisis de la fluctuación del contenido en G+C
- ¿Existen picos y valles?
- ¿A que corresponden?
- Análisis de la composición en dinucleótidos
- Análisis de la fluctuación del contenido en G+C
Fecha límite de entrega: 15 de febrero 2024.
2. Análisis del ensamblado
- Caracterizar la calidad del ensamblado
- Calcular en G+C del ensamblado
- Predecir genes codificantes
- Cuantos genes codificantes se predicen
- Que % del ensamblado cubren los genes codificantes
- Anotar los genes predichos
- ¿Que parámetros del Blast influyen en el % de genes predichos anotados?
- Analizar la variación en el G+C a lo largo del contig mas largo
- ¿Podemos determinar el orden real de los contigs en el genoma?
- Detectar genes del ARN ribosómico
- Determinar el uso de codones
- ¿Los genes predichos tienen un uso de codones diferentes comparado con la anotación del genoma de referencia?
- ¿Los genes de resistencia tienen un uso de codones diferentes?