Home » simulacro20-21

simulacro20-21

Obtener una secuencia genómica y calcular el G+C y contenido en dinucleótidos

Tenemos las coordenadas genómicas del ensamblado balAcu1 de la ballena enana (Balaenoptera acutorostrata / Minke whale) KI537194:1,922,188-1,994,847

  • Calcular el G+C de la secuencia
  • Calcular las frecuencias de dinucleotidos
  • ¿Que dinucleótidos ocurren más frecuente y cuales menos frecuente de los esperado por azar? Razonar las frecuencias de al menos 3 dinucleótidos diferentes

 

La poliposis adenomatosa familiar (PAF) es una enfermedad hereditaria caracterizada por la aparición de gran número (más de 100 en la forma clásica) de pólipos del tipo adenomatoso (tumores benignos) en el colon y recto a partir de los 20 o 30 años. Dichos pólipos tienen una gran probabilidad de malignizarse a partir de los 30 años y transformarse en cáncer de colon. Responsable de la poliposis adenomatosa familiar es el gen APC.

Se ha logrado aislar y secuenciar un transcrito de este gen de un individuo sin antecedentes familiares que sufre esta enfermedad. (secuencia paciente)

  •  ¿Que ha causado la aparición de la enfermedad en este individuo? Razonar brevemente.
  • ¿De que isoforma del gen APC se trata?

 

Tenemos el transcrito NM_001132433

  • ¿A que gen y a que especie pertenece?
  • ¿Que es la longitud y el contenido en G+C de su región codificante?

 

Tenemos la siguiente secuencia de ADN de origen bacteriano.

  • ¿Cuantos genes completos contiene esta secuencia?
  • Anotar los nombres de los genes y la longitud de sus CDSs

 

Caracterizar una secuencia anónima

Tenemos la siguiente secuencia anónima.

  • ¿De qué especie es la secuencia?
  • ¿Corresponde a un gen conocido?
  • ¿Corresponde exactamente a un transcrito conocido?
  • ¿En qué cromosoma se ubica esta secuencia?
  • ¿Cuantos exones tendrá esta secuencia juzgando solamente por la salida del BLAT?

 

El gen XIST

Descargamos la secuencia del transcrito maduro del gen XIST: https://www.ncbi.nlm.nih.gov/nuccore/NR_001564.2

  • ¿En qué cromosoma se localiza el gen?
  • ¿Cuantos exones tiene?
  • ¿Cuantos exones codificantes tiene?

 

 

La insulina

Comparar las secuencias de la insulina (pre-proinsulina) a nivel de ADN (solamente la región codificante) y proteína entre humano y el macaco (Macaca fascicularis)

  • ¿En qué alineamiento (ADN o proteína) podemos observar más cambios evolutivos? ¿Porque?
  • Analizamos las posiciones con desemparejamientos en el alineamiento de las CDS. ¿Las posiciones se distribuyen aleatoriamente o podemos detectar algún patrón?

 

https://bioinfo2.ugr.es/bioinfo/wp-content/uploads/2021/02/macaca_insulin_cds.txt

https://bioinfo2.ugr.es/bioinfo/wp-content/uploads/2021/02/macaca_insulin_prot.txt

https://bioinfo2.ugr.es/bioinfo/wp-content/uploads/2021/02/human_insulin_cds.txt

https://bioinfo2.ugr.es/bioinfo/wp-content/uploads/2021/02/human_insulin_prot.txt