Introducción

El análisis de secuencias forma parte de la biología computacional, biocomputación o bioinformática, un campo relativamente reciente. Aunque es difícil determinar exactamente su origen, se trata de una disciplina científica con un rapidísimo desarrollo, basado fundamentalmente en los extraordinarios avances hechos en secuenciación genómica y en las técnicas para la elaboración de mapas genéticos, además de en otras disciplinas biológicas y biotecnológicas.

La enorme avalancha de datos producida por la genómica, en forma principalmente de secuencias primarias de multitud de genes y proteínas de todo tipo de organismos, plantea el reto de encontrar su significado, es decir cómo transformar esos datos en información útil que permita el desarrollo de nuevos medicamentos, nuevos avances en la curación de enfermedades y, en definitiva, una mayor comprensión de cómo funcionan los seres vivos.

La herramienta principal para encontrar sentido a esta avalancha de datos moleculares es el ordenador. La biología computacional se ocupa de cómo utilizar la potencia de las herramientas computacionales para modelar y comprender los sistemas biológicos.

Para algunos la bioinformática también incluye el estudio del flujo de información que va de los ácidos nucleicos a las proteínas. La bioinformática trataría de comprender entonces qué es lo que queremos decir cuando hablamos de que los genes codifican algún rasgo fenotípico, como por ejemplo el color del pelo, la inteligencia o la susceptibilidad al cáncer.

La bioinformática se puede describir como la ciencia que permite crear y gestionar bases de datos biológicos, tratando de registrar, y eventualmente simular, toda la complejidad del ser vivo. Este enfoque se basa en la estructura jerárquica de los genes, su ordenamiento dentro del genoma, la función de las proteínas para las que codifican y las interacciones entre estas proteínas, que da lugar al mantenimiento del metabolismo, la reproducción y la forma.