|
|
Medios: Todos, MENOS el contacto con terceros mediante móvil, programas de chateo u otras formas de comunicación.
Duración: 2 horas
Las respuestas se darán en un fichero Word o PDF que se mandará a se.rg1771038549u.og@1771038549grebn1771038549ekcah1771038549 al finalizar la prueba poniendo ‘prueba bioinformática’ en el asunto. Nombrar el fichero de texto usando nombre/apellidos.
Razonar todas las respuestas. Indicar los comandos o programas usados. Usar capturas de pantalla.
En el servidor de docencia (alu.ugr.es – puerto 2212) se ha generado una carpeta /opt/bioinfo/ex_26
1) (1 punto) Crear una carpeta dentro de la carpeta ‘/opt/bioinfo/ex_26 que tenga como nombre el primer apellido y nombre del estudiante. Incluir dentro un fichero de texto llamado ‘Asistencia.txt’ que contenga la frase ‘He asistido al examen de Bioinformática’ y el nombre completo del estudiante.
2) (6 puntos) Tenemos las siguientes coordenadas chr12:56,645,901-56,763,680 que se refieren al ensamblado mm10 de Mus musculus
- (3 puntos) Descargar la secuencia correspondiente y depositarla dentro del la carpeta del estudiante (/opt/bioinfo/nombre/secuencia.txt)
- (3 puntos) Determinar la longitud y el G+C de la secuencia
3) (18 puntos) Tenemos la siguiente secuencia anónima: secuencia
- (2) Determinar el nombre del gen y la ID del transcrito en la base de datos RefSeq
- (3) ¿La secuencia corresponde exactamente a la entrada en la base de datos?
Hemos obtenido una secuencia mutada del mismo gen: secuencia mutada
- (6) Determinar las posiciones mutadas y el tipo de mutación (base en el transcrito de referencia -> base en el transcrito mutado)
- (6) ¿Que impacto tienen las mutaciones a nivel de proteína?
4) (5 puntos) Tenemos la siguiente secuencia consenso de un retrotransposon Alu (AluYb9).
Determinar el número de posiciones en el genoma humano en las que esta secuencia alinea perfectamente en toda su longitud.
5) (5 puntos) Tenemos las siguientes secuencias anónimas: sec1 y sec2
¿Cual de las dos secuencias proviene mas probablemente de un mamífero?
6) Linux (15 puntos)
Dentro de la carpeta del examen tenemos el fichero blast_output.txt (formato del fichero)
- (3 puntos) ¿Cuantas líneas tiene el fichero?
- (4 puntos) ¿Cuantas secuencias dianas diferentes (secuencias de la base de datos) se han detectado en estos resultados?
- (4 puntos) ¿Cuantos resultados tienen una longitud de alineamiento por encima de 1000 pares de bases?
- (4 puntos) ¿Cuantos resultados tiene una ‘query coverage’ (cobertura de la secuencia de entrada) >= 95%