Análisis composicional

Empezaremos determinando la longitud y el contenido global en G+C (%GC) de una secuencia (infoseq).

También es interesante determinar la variación espacial del %GC a lo largo de una secuencia (freak).

La composición de una secuencia de ADN se puede estudiar determinando las frecuencias de mononucleótidos, dinucleótidos, etc

Para ello se usa una ventana movil que se va desplazando posición a posición a lo largo de la secuencia (compseq). Por ejemplo, para determinar la frecuencia de dinucleótidos se usa una ventana de tamaño 2 y salto de 1:

ATTCCGTGAACTG…

AT, TT, TC, CG, GT…