Home » Genoma codificante y no codificante

Genoma codificante y no codificante

Presentación

Para seguir esta práctica de forma interactiva se recomienda el login como estudiante en https://www.socrative.com en el aula GENOMICA101.

¿Cuántos genes codificantes hay en el genoma humano?

  1. Entramos en Galaxy e importamos la anotación completa de los tránscritos: Get Data > UCSC Main> group: Genes and gene predictions;track:NCBI RefSeq (o Refseq genes); output format: all fields from selected table.
  2. Seleccionamos solo las líneas que corresponden a genes codificantes: Filter and Sort> Select e introducimos la expresión .*NM_[0-9]+.* (Esta expresión regular seleccionará solamente los genes con una ID que empiece con “NM_” . Para probar nuestras expresiones regulares podemos usar la página https://regex101.com y usamos como “flavor” python.
  3. Agrupamos por nombre del gen para asegurarnos que solo se genera una línea por nombre: Join, Substract and Group> Group, seleccionamos la columna correspondiente al header “name2” y agrupamos. El número de líneas se corresponde al número de genes codificantes.

 

¿Qué porcentaje del genoma corresponde a genes codificantes?

Esta pregunta puede responderse de 3 maneras diferentes:

Referida a gen completo (Exones+intrones)

  • Get Data > UCSC Main> group: Genes and gene predictions;track:NCBI RefSeq; output format: BED> Send query to Galaxy
  • Filter and Sort> Sort y seleccionamos el dataset filtrada con los genes codificantes
  • Seleccionamos solo las líneas que corresponden a genes codificantes
  • Sobre esa salida realizamos Operate on Genomic Intervals> Base Coverage
  • El número de bases resultantes la dividimos por el número total (aproximado de bases en el genoma) 3200000000

Referida solamente a exones

  • Get Data > UCSC Main> group: Genes and gene predictions;track:NCBI RefSeq; output format: BED> Exons plus 0 > Send query to Galaxy
  • Filter and Sort> Sort y seleccionamos el dataset filtrada con los genes codificantes
  • Seleccionamos solo las líneas que corresponden a genes codificantes
  • Sobre esa salida realizamos Operate on Genomic Intervals> Base Coverage
  • El número de bases resultantes la dividimos por el número total (aproximado de bases en el genoma) 3200000000

Referida solamente a la parte codificante de la secuencia (CDS)

  • Get Data > UCSC Main> group: Genes and gene predictions;track:NCBI RefSeq; output format: BED> Coding Exons > Send query to Galaxy
  • Filter and Sort> Sort y seleccionamos el dataset filtrada con los genes codificantes
  • Seleccionamos solo las líneas que corresponden a genes codificantes
  • Sobre esa salida realizamos Operate on Genomic Intervals> Base Coverage
  • El número de bases resultantes la dividimos por el número total (aproximado de bases en el genoma) 3200000000

 

Ejercicio de clase: Calcular el número medio de exones en genes codificantes, calcular el número medio de exones no codificantes.

Anuncios

Prueba: Lunes 16 de diciembre, 12h, aula C02

__________________________________

Tutoría colectiva: Viernes 13 de diciembre, 11h, aula C01

__________________________________

Práctica 2: Miércoles 30 de Octubre, 10h, aulas Inf O21/22


Práctica 1: Jueves 17 de Octubre, 10h, Laboratorio polivalente, sótano de matemáticas


Aula de teoría: C02

Practicas con ordenador: O21/O22

Comienzo de las clases: Las clases de Genómica comenzarán el martes 17 de septiembre a las 10h.

—————————

Para un mayor aprovechamiento de la asignatura, se recomienda acudir a clase con ordenador portatil o tableta.