{"id":6,"date":"2013-05-29T20:27:03","date_gmt":"2013-05-29T18:27:03","guid":{"rendered":"https:\/\/bioinfo2.ugr.es\/bioinfo\/?page_id=6"},"modified":"2026-01-27T09:25:57","modified_gmt":"2026-01-27T07:25:57","slug":"bases-de-datos","status":"publish","type":"page","link":"https:\/\/bioinfo2.ugr.es\/bioinfo\/bases-de-datos\/","title":{"rendered":"Bases de datos"},"content":{"rendered":"<div class=\"entry-content clearfix\">\n<div class=\"entry-content clearfix\">\n<p>Las secuencias de genes y prote\u00ednas se almacenan en <strong>bases de datos estructuradas<\/strong> de forma que sea f\u00e1cil su almacenamiento y recuperaci\u00f3n.<\/p>\n<p>Adem\u00e1s de estas <strong>bases de datos primarias<\/strong>, existen otras muchas <strong>bases de datos derivadas<\/strong> con informaci\u00f3n m\u00e1s espec\u00edfica: estructuras 3D, perfiles de expresi\u00f3n g\u00e9nica, metilaci\u00f3n del ADN, estado de la cromatina, &#8230;&#8230;<\/p>\n<p>Tambi\u00e9n son interesantes las <strong>bases de datos de genomas completos<\/strong>, y las bases de datos bibliogr\u00e1ficas con referencia a secuencias.<\/p>\n<hr \/>\n<h2>Secuencias de ADN<\/h2>\n<div class=\"entry-content clearfix\">\n<p>Existen dos principales bases de datos p\u00fablicas de secuencias de ADN, una europea (<strong>EMBL Nucleotide Sequence Database<\/strong>) y otra americana (<strong>GenBank<\/strong>).<\/p>\n<p>El contenido de ambas bases de datos es ahora similar (de hecho, se sincronizan continuamente), pero el formato de los registros es diferente.<\/p>\n<ul>\n<li><a href=\"https:\/\/www.bioinformatics.org\/sms\/iupac.html\" target=\"_blank\" rel=\"noopener\">Nucleotide Base Codes (IUPAC)<\/a><\/li>\n<\/ul>\n<p><a href=\"http:\/\/www.ebi.ac.uk\/\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" class=\"alignnone size-full wp-image-872\" src=\"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-content\/uploads\/2013\/10\/EMBL-European-Bioinformatics-Institute-2013-10-16-13-43-33.png\" alt=\"EMBL European Bioinformatics Institute 2013-10-16 13-43-33\" width=\"110\" height=\"32\" \/><\/a><\/p>\n<ul>\n<li><a href=\"https:\/\/www.ebi.ac.uk\/ena\/browser\/view\/BN000065\" target=\"_blank\" rel=\"noopener\">Entrada de ejemplo<\/a><\/li>\n<li><a href=\"ftp:\/\/ftp.ebi.ac.uk\/pub\/databases\/embl\/doc\/FT_current.html\" target=\"_blank\" rel=\"noopener\">Feature table<\/a><a tabindex=\"-1\" href=\"ftp:\/\/ftp.ebi.ac.uk\/pub\/databases\/embl\/doc\/FT_current.html\" target=\"_blank\" rel=\"noopener\">ftp:\/\u2026k\/pub\/databases\/embl\/doc\/FT_current<\/a><\/li>\n<li><a href=\"http:\/\/www.ebi.ac.uk\/ena\/about\/statistics\" target=\"_blank\" rel=\"noopener\">Estad\u00edstica<\/a><\/li>\n<\/ul>\n<p><a href=\"http:\/\/www.ncbi.nlm.nih.gov\/\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" class=\"alignnone size-full wp-image-871\" src=\"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-content\/uploads\/2013\/10\/National-Center-for-Biotechnology-Information-2013-10-16-13-44-21.png\" alt=\"National Center for Biotechnology Information 2013-10-16 13-44-21\" width=\"139\" height=\"64\" \/><\/a><\/p>\n<ul>\n<li><a href=\"http:\/\/www.ncbi.nlm.nih.gov\/genbank\/\" target=\"_blank\" rel=\"noopener\">GenBank<\/a><\/li>\n<li><a href=\"http:\/\/www.ncbi.nlm.nih.gov\/Sitemap\/samplerecord.html\" target=\"_blank\" rel=\"noopener\">Entrada de ejemplo<\/a><\/li>\n<li><a href=\"https:\/\/www.ncbi.nlm.nih.gov\/genbank\/statistics\/\" target=\"_blank\" rel=\"noopener\">Estad\u00edstica<\/a><\/li>\n<\/ul>\n<hr \/>\n<h2>Codificaci\u00f3n de la informaci\u00f3n<\/h2>\n<div class=\"entry-content clearfix\">\n<ul>\n<li>Con la excepci\u00f3n tan solo de algunos virus, el material gen\u00e9tico est\u00e1 constituido por DNA.<\/li>\n<li>El DNA generalmente consiste de dos cadenas complementarias arrolladas una en torno a otra para formar una h\u00e9lice dextr\u00f3gira. <strong>Cada cadena es un polinucle\u00f3tido lineal de dos purinas R (A y G) y dos pirimidinas Y (T y C)<\/strong>.<\/li>\n<li>Mientras que los nucle\u00f3tidos de una misma cadena se unen por enlaces fosfodiester (covalentes), los que se situan en cadenas complementarias se unen por enlaces m\u00e1s d\u00e9biles (puentes de hidr\u00f3geno). Estos se establecen entre<strong> bases complementarias: AT (W, weak) y CG (S, strong)<\/strong>.<\/li>\n<li>El enlace fosfodiester entre los nucle\u00f3tidos de una misma cadena se establece entre el fosfato terminal en 5\u2032 y el OH terminal en 3\u2032. En consecuencia, cada hebra de DNA est\u00e1 orientada, es decir, tiene una polaridad. La doble h\u00e9lice se forma por el apareamiento de <strong>cadenas antiparalelas<\/strong>.<\/li>\n<li>La orientaci\u00f3n del polinucle\u00f3tido hace que la secuencia 5\u2032-G-C-A-A-T-3\u2032 no sea la misma que 3\u2032-G-C-A-A-T-5\u2032.<\/li>\n<li>Por convenci\u00f3n, <strong>las secuencias de DNA se escriben en el sentido en que se transcriben<\/strong>, es decir desde el extremo 5\u2032 (a la izquierda, aguas arriba) hasta el 3\u2032 (a la derecha, aguas abajo).<\/li>\n<li>Por convenci\u00f3n tambi\u00e9n,<strong> la hebra que se suele almacenar en las bases de datos es la que NO se transcribe<\/strong> (en el caso de que se conozca), por la sencilla raz\u00f3n de que tiene la misma secuencia que el RNA mensajero (T \u2013&gt;U).<\/li>\n<li>La longitud se expresa en bp (pares de bases en el DNA y en el RNA de doble cadena, y bases en el RNA de cadena sencilla), Kb y Mb.<\/li>\n<\/ul>\n<hr \/>\n<h2>Secuencias de prote\u00ednas<\/h2>\n<p><a href=\"http:\/\/www.uniprot.org\/\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" class=\"alignnone size-medium wp-image-476\" src=\"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-content\/uploads\/2013\/05\/UniProt-300x136.gif\" alt=\"UniProt\" width=\"300\" height=\"136\" \/><\/a><\/p>\n<hr \/>\n<h2>Genomas completos<\/h2>\n<div class=\"entry-content clearfix\">\n<p>En las bases de datos de secuencias de nucle\u00f3tidos que acabamos de ver (EMBL, GenBank) se pueden encontrar las secuencias totales o parciales de muchos genes. Sin embargo, las secuencias gen\u00f3micas completas (los llamados ensamblados cromos\u00f3micos o gen\u00f3micos) son menos abundantes.<\/p>\n<p>Tanto el EBI como el NCBI mantienen actualizadas sendas tablas con los genomas que se van completando. Estas p\u00e1ginas permiten descargarse el genoma completo de un n\u00famero creciente de organismos.<\/p>\n<ul>\n<li><a href=\"http:\/\/www.ebi.ac.uk\/genomes\/\" target=\"_blank\" rel=\"noopener\">EBI \u2013 Genomas completos<\/a><\/li>\n<li><a href=\"http:\/\/www.ncbi.nlm.nih.gov\/sites\/genome\" target=\"_blank\" rel=\"noopener\">NCBI \u2013 Genomas completos<\/a><\/li>\n<\/ul>\n<\/div>\n<\/div>\n<hr \/>\n<h2>Ejercicios<\/h2>\n<div class=\"entry-content clearfix\">\n<div>\n<h3>A<\/h3>\n<ol>\n<li>Busque \u2018<strong>hiv2ben<\/strong>\u2019 en el <a href=\"http:\/\/www.ncbi.nlm.nih.gov\/gquery\/\" target=\"_blank\" rel=\"noopener\">NCBI<\/a><\/li>\n<li>Ver\u00e1 que aparecen 2 registros en el apartado <strong>Genomes -&gt; Nucleotide<\/strong><\/li>\n<li>Pinche sobre \u2018Human immunodeficiency virus type 2, complete proviral genome\u2019. Se obtiene la entrada del HIV en <strong>formato GenBank<\/strong> (10312 bp).<\/li>\n<li>Examine los primeros apartados de la anotaci\u00f3n: LOCUS, DEFINITION, ACCESSION\u2026 y sus distintos campos. Anote el n\u00famero de registro (Accession) asignado a esta secuencia: U38293<\/li>\n<li>Analice en detalle la tabla de FEATURES: gene, CDS, translation\u2026<\/li>\n<li>Busque la linea ORIGIN y preste atenci\u00f3n a la manera en que se lista la secuencia de nucle\u00f3tidos<\/li>\n<li>Guarde en disco una copia de la entrada: Arriba a la derecha (<strong>Send<\/strong> \u2013&gt; Complete record \u2013&gt; File \u2013&gt; Format GenBank \u2013&gt; Create File) y elija una carpeta para guardarla. Despu\u00e9s env\u00ede el archivo a su buz\u00f3n de correo.<\/li>\n<\/ol>\n<h3>B<\/h3>\n<ol>\n<li>Vuelva al principio de la entrada y pinche en \u2018<strong>FASTA<\/strong>\u2019.<\/li>\n<li>N\u00f3tese el formato compacto para la secuencia y la \u00fanica linea de anotaci\u00f3n comenzando por el s\u00edmbolo \u2018&gt;\u2019<\/li>\n<\/ol>\n<h3>C<\/h3>\n<ol>\n<li>Pinche ahora en \u2018<strong>Graphics<\/strong>\u2019 y explore la secuencia con ayuda del navegador gr\u00e1fico<\/li>\n<li>Haga zoom hasta el nivel de secuencia mediante el boton \u2018<strong>ATG<\/strong>\u2019, mu\u00e9vase con las flechas a derecha e izquierda y examine los codones de inicio y de stop de cada gen<\/li>\n<li>Utilice el bot\u00f3n \u2018<strong>Link to this page<\/strong>\u2019 (arriba a la derecha) para obtener un enlace a esa p\u00e1gina (Tiny URL) y enviarlo a su buz\u00f3n de correo<\/li>\n<\/ol>\n<h3>D<\/h3>\n<ol>\n<li>Usando el n\u00famero de registro <strong>U38293<\/strong>, busque ahora esta secuencia en la <a href=\"http:\/\/www.ebi.ac.uk\/\" target=\"_blank\" rel=\"noopener\">base de datos de nucle\u00f3tidos del EMBL<\/a><\/li>\n<li>Pinche en el enlace correspondiente en el apartado \u2018<strong>Nucleotide sequences<\/strong>\u2019 y examine la entrada con el navegador integrado.<\/li>\n<li>Pinche en el bot\u00f3n <strong>TEXT<\/strong> (arriba a la izquierda) o en la pesta\u00f1a <strong>Sequence<\/strong> y examine la entrada en formato EMBL. Note las diferencias con el formato GenBank.<\/li>\n<li>En el panel gr\u00e1fico \u2018<strong>Overview<\/strong>\u2019 cambie las coordenadas para examinar distintas partes de la secuencia (<strong>Base range<\/strong>, arriba a la derecha).<\/li>\n<li>Pinchando con el bot\u00f3n derecho sobre el panel \u2018<strong>Overview<\/strong>\u2019, guarde una imagen en formato <strong>jpeg<\/strong> de una regi\u00f3n de la secuencia y env\u00edela a su buz\u00f3n de correo.<\/li>\n<\/ol>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Las secuencias de genes y prote\u00ednas se almacenan en bases de datos estructuradas de forma que sea f\u00e1cil su almacenamiento y recuperaci\u00f3n. Adem\u00e1s de estas bases de datos primarias, existen otras muchas bases de datos derivadas con informaci\u00f3n m\u00e1s espec\u00edfica: estructuras 3D, perfiles de expresi\u00f3n g\u00e9nica, metilaci\u00f3n del ADN, estado de la cromatina, &#8230;&#8230; Tambi\u00e9n &hellip; <a href=\"https:\/\/bioinfo2.ugr.es\/bioinfo\/bases-de-datos\/\">Continue reading <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":2,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"_links":{"self":[{"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/pages\/6"}],"collection":[{"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/comments?post=6"}],"version-history":[{"count":10,"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/pages\/6\/revisions"}],"predecessor-version":[{"id":1974,"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/pages\/6\/revisions\/1974"}],"wp:attachment":[{"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/media?parent=6"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}