{"id":1056,"date":"2017-09-15T18:08:18","date_gmt":"2017-09-15T16:08:18","guid":{"rendered":"http:\/\/bioinfo2.ugr.es\/biocomputacion\/?page_id=1056"},"modified":"2025-10-03T08:49:20","modified_gmt":"2025-10-03T06:49:20","slug":"analisis-basico","status":"publish","type":"page","link":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/analisis-basico\/","title":{"rendered":"An\u00e1lisis b\u00e1sico"},"content":{"rendered":"<h3>An\u00e1lisis composicional<\/h3>\n<p>La composici\u00f3n de la secuencia permite en muchos casos obtener una primera idea acerca de la especie de que proviene, sobre los elementos funcionales que podr\u00eda contener y sobre los procesos evolutivos. Para ello, <strong>de especial inter\u00e9s ser\u00e1n las frecuencias de mono y di-nucle\u00f3tidos y el contenido en G+C a lo largo de la secuencia<\/strong>.<\/p>\n<p>Para el an\u00e1lisis composicional, disponemos de una serie de programas de <a href=\"https:\/\/emboss.sourceforge.net\" target=\"_blank\" rel=\"noopener\">EMBOSS<\/a> \/ <a href=\"https:\/\/es.wikipedia.org\/wiki\/EMBOSS\" target=\"_blank\" rel=\"noopener\">EMBOSS-Wiki<\/a>.<\/p>\n<div>\n<div class=\"entry-content clearfix\">\n<h4><\/h4>\n<h4><strong>Determinar la longitud y el contenido global en G+C (%GC) de una secuencia mediante el programa <a href=\"http:\/\/emboss.bioinformatics.nl\/cgi-bin\/emboss\/help\/infoseq\" target=\"_blank\" rel=\"noopener\"><i>infoseq<\/i><\/a>.<\/strong><\/h4>\n<\/div>\n<p>para lanzar infoseq en linea de comando:<\/p>\n<pre> infoseq -help<\/pre>\n<p>Secuencia de ejemplo:\u00a0<a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2017\/09\/sec29.txt\">sec29<\/a><\/p>\n<\/div>\n<h4><\/h4>\n<h4>Analizar la variaci\u00f3n espacial del %GC a lo largo de una secuencia (<a href=\"http:\/\/emboss.bioinformatics.nl\/cgi-bin\/emboss\/help\/freak\" target=\"_blank\" rel=\"noopener\"><b><i>freak<\/i><\/b><\/a>).<\/h4>\n<pre><span style=\"color: #333333;\">freak -help<\/span><\/pre>\n<p>Secuencia de ejemplo:\u00a0<a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2017\/09\/MHC_LH_clean.txt\">secuencia_MHC<\/a><\/p>\n<p><strong>Ejercicio: <\/strong><\/p>\n<p>Comparar la fluctuaci\u00f3n del %G+C de la secuencia_MHC con la de NC_006461.1<\/p>\n<p><strong>Preguntas:\u00a0<\/strong><\/p>\n<ul>\n<li>\u00bfQue observamos en la distribuci\u00f3n del G+C en la secuencia MHC y que explicaci\u00f3n puede tener?<\/li>\n<li>\u00bfQue diferencias observamos si comparamos la distribuci\u00f3n espacial del G+C entre las dos secuencias?<\/li>\n<\/ul>\n<h4>La composici\u00f3n de una secuencia de ADN se puede estudiar determinando las frecuencias de mononucle\u00f3tidos, dinucle\u00f3tidos, etc<\/h4>\n<div class=\"entry-content clearfix\">\n<p>Para ello se usa una ventana movil que se va desplazando posici\u00f3n a posici\u00f3n a lo largo de la secuencia (<a href=\"http:\/\/emboss.bioinformatics.nl\/cgi-bin\/emboss\/help\/compseq\" target=\"_blank\" rel=\"noopener\"><b><i>compseq<\/i><\/b><\/a>). Por ejemplo, para determinar la frecuencia de dinucle\u00f3tidos se usa una ventana de tama\u00f1o 2 y salto de 1:<\/p>\n<p>ATTCCGTGAACTG\u2026<\/p>\n<p>AT, TT, TC, CG, GT\u2026<\/p>\n<p><strong>Secuencias de ejemplo<\/strong>:\u00a0<a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2017\/09\/sec29.txt\">sec29<\/a>,\u00a0<a href=\"http:\/\/www.ncbi.nlm.nih.gov\/nuccore\/NC_007633.1\" target=\"_blank\" rel=\"noopener\">Mycoplasma capricolum<\/a>\u00a0,\u00a0<a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2017\/09\/secuencia_con_N.txt\">secuencia_N<\/a><\/p>\n<p><strong>Ejercicios:<\/strong><\/p>\n<ul>\n<li>Comparar la composici\u00f3n de la\u00a0\u00a0<a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2017\/09\/sec29.txt\">sec29<\/a>\u00a0con una secuencia obtenida de <em>C. elegans <a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/getdnaandcopy\/\">(\u00bfComo?)<\/a><\/em><\/li>\n<li>Determinar el uso de nucle\u00f3tidos de las 3 secuencias<\/li>\n<li>Aleatorizar (<a href=\"http:\/\/emboss.bioinformatics.nl\/cgi-bin\/emboss\/help\/shuffleseq\" target=\"_blank\" rel=\"noopener\">suffleseq<\/a>) la <a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2017\/09\/sec29.txt\">sec29<\/a>\u00a0y determinar el uso de dinucle\u00f3tidos<\/li>\n<\/ul>\n<p><strong>Preguntas:<\/strong><\/p>\n<\/div>\n<ul>\n<li>\u00bfCu\u00e1l es el m\u00e9todo m\u00e1s indicado para estimar la frecuencia esperada de los dinucle\u00f3tidos?<\/li>\n<li>\u00bfExisten algunos dinucle\u00f3tidos con frecuencias observadas muy distintas a las esperadas?<\/li>\n<li>\u00bfA qu\u00e9 mecanismos bioqu\u00edmicos y evolutivos se deben este fen\u00f3meno?<\/li>\n<li>\u00bfQue observamos para la secuencia de un procariota?<\/li>\n<li>\u00bfQue diferencias hay en el uso de dinucle\u00f3tidos entre las sec29 y su secuencia randomizada? \u00bfPorque?<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<div class=\"entry-content clearfix\">\n<h2>Uso de codones<\/h2>\n<p>Es importante subrayar que los codones no se cuentan c\u00f3mo los trinucle\u00f3tidos. Estos \u00faltimos se cuentan mediante <i><b>compseq <\/b><\/i>con una ventana solapante. Los codones son tambi\u00e9n trinucl\u00e9otidos, pero NO solapantes. Otra cuesti\u00f3n a tener en cuenta es que los codones hay que contarlos en la fase correcta. El recuento de codones hay que hacerlo pues con el programa <i><b>cusp<\/b><\/i>. El uso de codones (o dialecto gen\u00e9tico) es especie-espec\u00edfico en organismos unicelulares y regi\u00f3n-espec\u00edfico en multicelulares.<\/p>\n<ul>\n<li><a href=\"http:\/\/www.ncbi.nlm.nih.gov\/Taxonomy\/Utils\/wprintgc.cgi?mode=c#SG1\" target=\"_blank\" rel=\"noopener\">Tabla del c\u00f3digo gen\u00e9tico standard<\/a><\/li>\n<li><a href=\"http:\/\/www.ncbi.nlm.nih.gov\/nuccore\/NM_000558.3\" target=\"_blank\" rel=\"noopener\">CDS de la alfa-globina humana<\/a><\/li>\n<li><a href=\"http:\/\/emboss.bioinformatics.nl\/cgi-bin\/emboss\/cusp\" target=\"_blank\" rel=\"noopener\">cusp \u2013 EMBOSS<\/a><\/li>\n<li><a href=\"http:\/\/www.kazusa.or.jp\/codon\/\" target=\"_blank\" rel=\"noopener\">Codon Usage Database<\/a><\/li>\n<li>Ejercicio: Usando <b><i>cusp<\/i><\/b>, determine y compare las tablas de uso de codones de dos genes (CDSs) del <a href=\"http:\/\/www.google.es\/url?sa=t&amp;rct=j&amp;q=&amp;esrc=s&amp;source=web&amp;cd=1&amp;ved=0CDQQFjAA&amp;url=http%3A%2F%2Fwww.ebi.ac.uk%2FTools%2Fdbfetch%2Femblfetch%3Fm30502&amp;ei=DeesUb7HCKuO7QaTqIGQCg&amp;usg=AFQjCNHqdkB6JMxq3iBlf0CsvCciycyT0g&amp;sig2=9QCKyosacEQfqPkAe0NlJw&amp;bvm=bv.47244034,d.ZGU&amp;cad=rja\" target=\"_blank\" rel=\"noopener\">HIV<\/a>.<\/li>\n<\/ul>\n<\/div>\n<h4>Ejercicios<\/h4>\n<ul>\n<li>Analizar el uso de codones de la\u00a0<a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2017\/09\/sec29.txt\">sec29<\/a><\/li>\n<li>Analizar el uso de codones de la bacteria <a href=\"http:\/\/www.ncbi.nlm.nih.gov\/nuccore\/NC_006461.1\" target=\"_blank\" rel=\"noopener\">Thermus thermophilus<\/a>\n<ol>\n<li>Obtener todas las secuencias de las CDS<\/li>\n<li>Obtener el uso de codones mediante el programa <a href=\"http:\/\/emboss.bioinformatics.nl\/cgi-bin\/emboss\/cusp\" target=\"_blank\" rel=\"noopener\">CUSP<\/a><\/li>\n<\/ol>\n<\/li>\n<\/ul>\n<div class=\"entry-content clearfix\"><\/div>\n","protected":false},"excerpt":{"rendered":"<p>An\u00e1lisis composicional La composici\u00f3n de la secuencia permite en muchos casos obtener una primera idea acerca de la especie de que proviene, sobre los elementos funcionales que podr\u00eda contener y sobre los procesos evolutivos. Para ello, de especial inter\u00e9s ser\u00e1n <a href=\"https:\/\/bioinfo2.ugr.es\/biocomputacion\/analisis-basico\/\" class=\"read-more\">Read More &#8230;<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"_links":{"self":[{"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/pages\/1056"}],"collection":[{"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/comments?post=1056"}],"version-history":[{"count":7,"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/pages\/1056\/revisions"}],"predecessor-version":[{"id":2564,"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/pages\/1056\/revisions\/2564"}],"wp:attachment":[{"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/media?parent=1056"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}