Simulacro

Generalidades:

Duración: 1,25 horas

Medios: Podemos usar todo MENOS al vecino, el móvil, programas de chateo u otras formas de comunicar con terceros

Importante: no navegar ni copiar nada dentro de la carpeta de otro estudiante

Las respuestas se dan en un fichero de texto (por ejemplo Word) que se mandará a al finalizar la prueba poniendo ‘prueba biocomputación’ en el asunto

1. En el servidor de docencia (bioinfo2.ugr.es – puerto 2424) se ha generado un carpeta /home/biocomp/simulacro

(2 puntos) Crear una carpeta dentro de la carpeta ‘simulacro’ que tenga como nombre el primer apellido y nombre del estudiante sustituyendo ñ por n y omitiendo acentos.

 

2. La poliposis adenomatosa familiar (PAF) es una enfermedad hereditaria caracterizada por la aparición de gran número (más de 100 en la forma clásica) de pólipos del tipo adenomatoso (tumores benignos) en el colon y recto a partir de los 20 o 30 años. Dichos pólipos tienen una gran probabilidad de malignizarse a partir de los 30 años y transformarse en cáncer de colon. Responsable de la poliposis adenomatosa familiar es el gen APC.

Se ha logrado aislar y secuenciar un transcrito de este gen de un individuo sin antecedentes familiares que sufre esta enfermedad.

  • (1 P) Descargar la secuencia y guardarla en la carpeta del estudiante en el servidor (secuencia paciente)
  • (6 P) ¿Que ha causado la aparición de la enfermedad en este individuo? Razonar brevemente.
  • (1 P) ¿De que isoforma del gen APC se trata?

 

3. Obtener una secuencia genómica y calcular el G+C y contenido en CpG

Tenemos las coordenadas genómicas del ensamblado balAcu1 de la ballena enana (Balaenoptera acutorostrata / Minke whale) KI537194:1,922,188-1,994,847

  • (2 P) Descargar la secuencia y depositarla bajo el nombre balAcu_simu.fa en la carpeta
  • (2 P) Calcular el G+C de la secuencia
  • (2 P) Calcular las frecuencias de dinucleotidos
  • (4 P) ¿Que dinucleótidos ocurren mas frecuente y cuales menos frecuente de los esperado por azar? Razonar las frecuencias de al menos 3 dinucleótidos diferentes

4. Programación del Perl

Hay un fichero que se encuentra en el servidor de docencia el la ruta /home/biocomp/simulacro/cpg_chr1_sort.txt que contiene cierta información de todas las islas CpG del cromosoma 21. Las columnas del fichero están separadas mediante el tabulador (\t). Hay 4 columnas que corresponden a ‘nombre de la islas’, ‘longitud de la isla’, ‘numero de CpGs’ y ‘contenido en G+C’

  1. (1 P) copiar el fichero a la carpeta del estudiante
  2. (7 P) generar un pequeño script en perl para calcular la longitud media y el G+C medio de estas islas (dar estas medias en el fichero Word) y depositar el script en la carpeta del alumno