{"id":9,"date":"2013-05-29T20:28:21","date_gmt":"2013-05-29T18:28:21","guid":{"rendered":"https:\/\/bioinfo2.ugr.es\/bioinfo\/?page_id=9"},"modified":"2026-01-30T09:40:04","modified_gmt":"2026-01-30T07:40:04","slug":"rastreo-de-bases-de-datos","status":"publish","type":"page","link":"https:\/\/bioinfo2.ugr.es\/bioinfo\/rastreo-de-bases-de-datos\/","title":{"rendered":"Alineamiento local: rastreo de bases de datos"},"content":{"rendered":"<p>Hemos visto c\u00f3mo buscar secuencias mediante palabras clave. Pero en Bioinform\u00e1tica es m\u00e1s frecuente tener como dato de partida una secuencia parcial sin anotar, es decir una secuencia an\u00f3nima.\u00a0 En este caso se hace necesario hacer un &#8216;rastreo&#8217; de toda la base de datos de secuencias conocidas. Para ello es necesario alinear nuestra secuencia problema con todas y cada una de las secuencias que hay en la base de datos.\u00a0 Esto se consigue mediante los algoritmos de alineamiento local: FASTA y BLAST. Veamos como se usan estos programas.<\/p>\n<div align=\"center\">\u00a0<\/div>\n<table style=\"width: 100%; height: 69px;\" border=\"0\" width=\"425\" cellpadding=\"0\">\n<tbody>\n<tr style=\"height: 23px;\">\n<td style=\"height: 23px;\" width=\"45%\"><b>FASTA<\/b><\/td>\n<td style=\"height: 23px;\" width=\"52%\"><a href=\"http:\/\/www.ebi.ac.uk\/Tools\/sss\/fasta\/\" target=\"_blank\" rel=\"noopener\">EBI<\/a>, Cambridge<\/td>\n<\/tr>\n<tr style=\"height: 23px;\">\n<td style=\"height: 23px;\" width=\"45%\"><b>BLASTn (DNA) <\/b><\/td>\n<td style=\"height: 23px;\" width=\"52%\"><a href=\"http:\/\/www.ncbi.nlm.nih.gov\/blast\/Blast.cgi?CMD=Web&amp;LAYOUT=TwoWindows&amp;AUTO_FORMAT=Semiauto&amp;PAGE=Nucleotides&amp;NCBI_GI=yes&amp;FILTER=L&amp;HITLIST_SIZE=100&amp;SHOW_OVERVIEW=yes&amp;AUTO_FORMAT=yes&amp;SHOW_LINKOUT=yes\" target=\"_blank\" rel=\"noopener\">NCBI<\/a>, USA<\/td>\n<\/tr>\n<tr style=\"height: 23px;\">\n<td style=\"height: 23px;\" width=\"45%\"><b>BLASTp (prote\u00ednas)<\/b><\/td>\n<td style=\"height: 23px;\" width=\"52%\"><a href=\"http:\/\/www.ncbi.nlm.nih.gov\/blast\/Blast.cgi?CMD=Web&amp;LAYOUT=TwoWindows&amp;AUTO_FORMAT=Semiauto&amp;PAGE=Proteins&amp;NCBI_GI=yes&amp;HITLIST_SIZE=100&amp;COMPOSITION_BASED_STATISTICS=yes&amp;SHOW_OVERVIEW=yes&amp;AUTO_FORMAT=yes&amp;CDD_SEARCH=yes&amp;FILTER=L&amp;SHOW_LINKOUT=yes\" target=\"_blank\" rel=\"noopener\">NCBI<\/a>, USA<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n\n\n<p><strong>Secuencias para los ejercicios del <a href=\"https:\/\/blast.ncbi.nlm.nih.gov\/Blast.cgi\" target=\"_blank\" rel=\"noopener noreferrer\">BLAST<\/a><\/strong><\/p>\n<ul>\n<li><strong><a href=\"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-content\/uploads\/2022\/01\/anonsec_blastn.txt\" target=\"_blank\" rel=\"noopener\">Secuencia an\u00f3nima 1<\/a><\/strong><\/li>\n<li><a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2017\/09\/sequence.txt\">Sequencia 2<\/a><\/li>\n<\/ul>\n<p><b> Secuencia an\u00f3nima de prote\u00edna:<\/b><\/p>\n<pre><span style=\"font-family: courier new,courier,monospace; font-size: 8pt;\">MEEDRNWIVV PTWRVPGRME KWHALVKYLK YRTKDLEEVR YVPHHKVGWA WWTCSRVIFP\nLQGKSHLEIQ AYWNLTPEKG WLSSHAVRLT WYTEKFWTDV TPDCADILIH STYFSCFTAG\nEVRRAIRGEK LLSCCNYPQA HKAQVPSLQY LALVVVQQND RPQ<\/span><\/pre>\n<div id=\"primary\" class=\"content-area\"><main id=\"main\" class=\"site-main\" role=\"main\">\n<article id=\"post-1040\" class=\"post-1040 page type-page status-publish hentry\">\n<div class=\"entry-content\">\n<h3><strong>Preguntas:<\/strong><\/h3>\n<ul>\n<li>\u00bfDe gen se trata y a que especie pertenece?<\/li>\n<li>\u00bfEste gen tiene hom\u00f3logos en otras especies?<\/li>\n<li>\u00bfEste gen tiene variaci\u00f3n transcripcional y diferentes isoformas a nivel de prote\u00edna?<\/li>\n<li>\u00bfLa secuencia an\u00f3nima <em><strong>corresponde<\/strong> <\/em>perfectamente a la secuencia de la base de datos?<\/li>\n<\/ul>\n<h3><strong>Buscar informaci\u00f3n de un gen en <a href=\"https:\/\/www.ncbi.nlm.nih.gov\/gene\" target=\"_blank\" rel=\"noopener noreferrer\">NCBI gene<\/a><\/strong><\/h3>\n<p><strong>Preguntas:<\/strong><\/p>\n<ul>\n<li>\u00bfQu\u00e9 es la funci\u00f3n de este gen?<\/li>\n<li>\u00bfEl gen tiene hom\u00f3logos en otras especies?<\/li>\n<li>\u00bfEn que tejidos se expresa?<\/li>\n<li>\u00bfCon que otros genes interactua a nivel de prote\u00edna?<\/li>\n<li>\u00bfCuantas isoformas tiene?<\/li>\n<\/ul>\n<\/div>\n<\/article>\n<\/main>\n<h2>Generar un alineamiento local usando el algoritmo de Smith-Waterman<\/h2>\n<p><a href=\"https:\/\/www.ebi.ac.uk\/jdispatcher\/psa\/emboss_water\" target=\"_blank\" rel=\"noopener noreferrer\">EMBOSS en el EBI<\/a><\/p>\n<p><strong>Secuencias:\u00a0<\/strong><a href=\"https:\/\/www.ncbi.nlm.nih.gov\/protein\/237681119?report=genbank&amp;log$=prottop&amp;blast_rank=7&amp;RID=W6UHS5YY01R\" target=\"_blank\" rel=\"noopener noreferrer\">NP_009231.2<\/a>\u00a0y\u00a0<a href=\"https:\/\/www.ncbi.nlm.nih.gov\/protein\/6552299?report=genbank&amp;log$=prottop&amp;blast_rank=1&amp;RID=W6UHS5YY01R\" target=\"_blank\" rel=\"noopener noreferrer\">NP_009225.1<\/a><\/p>\n<p><strong>Preguntas<\/strong><\/p>\n<ul>\n<li>\u00bfA que corresponde el hueco en el alineamiento?<\/li>\n<li>\u00bfPodemos determinar el tipo de splicing?<\/li>\n<\/ul>\n<p data-cya11y-org-font-size=\"16\">&#8212;&#8212;&#8212;&#8212;&#8212;- Practicar con transcritos<\/p>\n<p data-cya11y-org-font-size=\"16\">Tenemos dos secuencias: La secuencia\u00a0<a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2026\/01\/NM_021009.txt\" target=\"_blank\" rel=\"noopener\" data-cya11y-org-font-size=\"16\">NM_021009<\/a>, el transcrito can\u00f3nico de la ubiquitina y una secuencia mutada de la misma\u00a0<a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2026\/01\/NM_021009_mut.txt\" target=\"_blank\" rel=\"noopener\" data-cya11y-org-font-size=\"16\">NM_021009_mut<\/a>.<\/p>\n<ul>\n<li data-cya11y-org-font-size=\"16\">Determinar los cambios que existen en la secuencia mutada. Indicar el tipo de cambio (mutaci\u00f3n de base \u00fanica, indel) y la posici\u00f3n<\/li>\n<li data-cya11y-org-font-size=\"16\">Determinar el impacto de las mutaciones a nivel de la prote\u00edna<\/li>\n<\/ul>\n<h2>Trabajar con las secuencias an\u00f3nimas<\/h2>\n<h3>Secuencia an\u00f3nima 3 (anon3.txt)<\/h3>\n<ul>\n<li>Usar Blast para averiguar la especie y si es posible la cepa a la que pertenece la secuencia an\u00f3nima 3<\/li>\n<li>Averiguar a que corresponden las estructuras de G+C (&#8216;picos&#8217; en %G+C) encontradas en la secuencia (usar extractseq para generar las subsecuencias que corresponden a los picos en %G+C)<\/li>\n<\/ul>\n<h3>Secuencia an\u00f3nima 2<\/h3>\n<div class=\"entry-content\">\n<p>Paso 1: B\u00fasqueda de la secuencia (<a href=\"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-content\/uploads\/2024\/01\/anon2.txt\">anon2<\/a>) en el genoma mediante <a href=\"https:\/\/genome.ucsc.edu\/cgi-bin\/hgBlat?command=start\" target=\"_blank\" rel=\"noopener noreferrer\">BLAT<\/a><\/p>\n<p><strong>Preguntas:<\/strong><\/p>\n<ul>\n<li>\u00bfA que cromosoma y coordenadas corresponde esta secuencia?<\/li>\n<\/ul>\n<p>Paso 2: analizar la regi\u00f3n mediante el <a href=\"https:\/\/bioinfo2.ugr.es\/bioinfo\/navegadores-genomicos\/\" target=\"_blank\" rel=\"noopener\">navegador gen\u00f3mico<\/a><\/p>\n<p><strong>Preguntas:<\/strong><\/p>\n<ul>\n<li>\u00bfQu\u00e9 gen contiene la secuencia?<\/li>\n<li>\u00bfQu\u00e9 funci\u00f3n tiene este gen, y\/o a que enfermedad(es) est\u00e1 asociado?<\/li>\n<li>\u00bfContiene una isla CpG?<\/li>\n<li>\u00bfExisten anotaci\u00f3nes de elementos reguladores?<\/li>\n<li>\u00bfQue porcentaje de la secuencia corresponde a elementos transponibles?<\/li>\n<li>\u00bfQue G+C tienen los exones?\u00bfY los intrones?<\/li>\n<\/ul>\n<p>Acceso a los datos mediante el Table Browser\/Genome Browser:\u00a0<\/p>\n<ul>\n<li>Descargar la secuencia (Genome Browser)<\/li>\n<li>Obtener\u00a0 una anotaci\u00f3n en formato BED<\/li>\n<li>Obtener una anotaci\u00f3n (formato libre)<\/li>\n<li>Obtener las secuencias de una anotaci\u00f3n<\/li>\n<\/ul>\n<\/div>\n<\/div>\n<h2 id=\"sidebar-primary\" class=\"widget-area\" role=\"complementary\">Tareas para las secuencias asignadas\u00a0<\/h2>\n<ul>\n<li>Determinar la especie\/cepa del genoma ensamblado<\/li>\n<li>Determinar las coordenadas cromos\u00f3micas (secuencia humana)<\/li>\n<\/ul>\n\n\n\n<p>\u00a0<\/p>\n<h2><a href=\"https:\/\/bioinfo2.ugr.es\/bioinfo\/resultados_alineamiento\/\" target=\"_blank\" rel=\"noopener\">Resultados<\/a><\/h2>\n","protected":false},"excerpt":{"rendered":"<p>Hemos visto c\u00f3mo buscar secuencias mediante palabras clave. Pero en Bioinform\u00e1tica es m\u00e1s frecuente tener como dato de partida una secuencia parcial sin anotar, es decir una secuencia an\u00f3nima.\u00a0 En este caso se hace necesario hacer un &#8216;rastreo&#8217; de toda la base de datos de secuencias conocidas. Para ello es necesario alinear nuestra secuencia problema &hellip; <a href=\"https:\/\/bioinfo2.ugr.es\/bioinfo\/rastreo-de-bases-de-datos\/\">Continue reading <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":4,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"_links":{"self":[{"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/pages\/9"}],"collection":[{"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/comments?post=9"}],"version-history":[{"count":21,"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/pages\/9\/revisions"}],"predecessor-version":[{"id":1976,"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/pages\/9\/revisions\/1976"}],"wp:attachment":[{"href":"https:\/\/bioinfo2.ugr.es\/bioinfo\/wp-json\/wp\/v2\/media?parent=9"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}