{"id":2480,"date":"2024-11-04T15:02:39","date_gmt":"2024-11-04T13:02:39","guid":{"rendered":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/?page_id=2480"},"modified":"2024-11-07T20:07:19","modified_gmt":"2024-11-07T18:07:19","slug":"preprocesar-smrna-seq","status":"publish","type":"page","link":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/preprocesar-smrna-seq\/","title":{"rendered":"preprocesar smRNA-seq"},"content":{"rendered":"<h3>Datos:<\/h3>\n<p>Datos humanos: los ficheros hsa1.fastq, hsa2.fastq, hsa3.fastq y <a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2018\/10\/miRNA_test.fastq_.gz\">miRNA test data<\/a><\/p>\n<p>Datos de trigo (<em>Triticum aestivum<\/em>): EC.fastq, ET.fastq<\/p>\n<p>Los ficheros se ubican en la carpeta <em>\/opt\/ngs<\/em> del servidor de docencia<\/p>\n<p>&nbsp;<\/p>\n<h3>Tareas y cuestiones:<\/h3>\n<ol>\n<li>Detectar el adaptador: Existen diferentes protocolos para la preparaci\u00f3n de la libreria. Antes de poder cuantificar la abundancia de microRNAs, tenemos que detectar el adaptador (y eliminarlo)\n<ul>\n<li>Consejo: usar grep y un microRNA conservado y de expresi\u00f3n ubicua como <a href=\"https:\/\/www.mirbase.org\/hairpin\/MI0006170\" target=\"_blank\" rel=\"noopener\">mir-159<\/a> o <a href=\"https:\/\/mirgenedb.org\/browse?qtype=mgid&amp;org=ALL&amp;query=let-7\" target=\"_blank\" rel=\"noopener\">let-7<\/a><\/li>\n<\/ul>\n<\/li>\n<li>Eliminar el adaptador:\n<ul>\n<li>Escribir un programa en python que detecte y elimine el adaptador<\/li>\n<li>El programa toma como entrada el fichero en formato fastq y la secuencia del adaptador<\/li>\n<li>La salida se produce en el mismo formato fastq eliminando las lecturas para las que no se ha detectado el adaptador<\/li>\n<li>Consejo:\n<ul>\n<li>normalmente se intenta detectar los primeros 10nt del adaptador<\/li>\n<li>explorar el m\u00e9todo index()<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<li>Contar el n\u00famero de lecturas \u00fanicas y generar un fichero compacto en formato fasta\n<ul>\n<li>&gt;ID#conteo<\/li>\n<li>secuencia de la lectura<\/li>\n<\/ul>\n<\/li>\n<li>Analizar las lecturas\n<ul>\n<li>\u00bfCuantas lecturas \u00fanicas hay en el fichero?<\/li>\n<li>\u00bfA que mol\u00e9cula corresponde la lectura mas frecuente? &#8211; \u00bfy la segunda mas frecuente?<\/li>\n<li>\u00bfCu\u00e1ntas lecturas \u00fanicas tienen una logitud mayor o igual a 18 nt?\n<ul>\n<li>Conteo unico: el n\u00famero lecturas diferentes (cada secuencia cuenta solamente una vez)<\/li>\n<li>Conteo total: El numero absoluto de lecturas (cada lectura cuenta las veces que ocurre en el fichero)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<li>Analizar la distribuci\u00f3n de la longitud de las lecturas (frecuencia para longitud 1nt, 2nt, etc) mediante un programa en python\n<ul>\n<li>\u00bfCuantos maximos (incluyendo locales) se pueden distinguir?<\/li>\n<li>Interpretar los maximos (qu\u00e9 los pueden causar, tipos de RNA, etc)<\/li>\n<li>\u00bfQue diferencias podemos observar si analizamos el conteo \u00fanico y el conteo total? \u00bfQue explicaci\u00f3n biol\u00f3gica tiene?<\/li>\n<\/ul>\n<\/li>\n<li>Darle identidad a las lecturas an\u00f3nimas\n<ul>\n<li>generar un fichero fasta eliminando:\n<ul>\n<li>lecturas con un conteo menor que 5<\/li>\n<li>lecturas con longitudes menores de 18nt o mayores de 26nt<\/li>\n<\/ul>\n<\/li>\n<li>lanzar un blast local frente a la base de datos miRBase (ver comando abajo)<\/li>\n<li>Contar el n\u00famero de lecturas mapeadas a cada secuencia de microRNA<\/li>\n<\/ul>\n<\/li>\n<\/ol>\n<p>Para hacer un blast local:<\/p>\n<pre>blastn -query 'ruta del fasta file' -db hsa_mature -outfmt 6 -out 'fichero de salida' -word_size 9<\/pre>\n<h3><a href=\"https:\/\/www.metagenomics.wiki\/tools\/blast\/blastn-output-format-6\">Explicaci\u00f3n de la salida de Blastn<\/a><\/h3>\n<p>&nbsp;<\/p>\n<p><strong>M\u00e1s cuestiones (a resolver program\u00e1ticamente)<\/strong><\/p>\n<ul>\n<li>\u00bfCuantas lecturas \u00fanicas se eliminan aplicando un minimo de 2?<\/li>\n<li>Aplicando un minimo de 5 lecturas, \u00bfque valor toma el conteo total?<\/li>\n<li>\u00bfCuantas lecturas totales y unicas hay entre 20 y 23 nucle\u00f3tidos?<\/li>\n<li>Parseando la salida del Blast, \u00bfcual es el microRNA m\u00e1s expresado?<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<h3><a href=\"http:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-content\/uploads\/2020\/12\/soluciones_preproII.zip\">Soluciones<\/a><\/h3>\n<h3>Ayuda<\/h3>\n<ol>\n<li>Explorar la opci\u00f3n &#8211;length y -o del <em>trim_galore<\/em><\/li>\n<li>Explorar los programas <em>grep<\/em> y <em>wc<\/em> disponibles en linea de comando<\/li>\n<li>la funci\u00f3n len() de python<\/li>\n<\/ol>\n","protected":false},"excerpt":{"rendered":"<p>Datos: Datos humanos: los ficheros hsa1.fastq, hsa2.fastq, hsa3.fastq y miRNA test data Datos de trigo (Triticum aestivum): EC.fastq, ET.fastq Los ficheros se ubican en la carpeta \/opt\/ngs del servidor de docencia &nbsp; Tareas y cuestiones: Detectar el adaptador: Existen diferentes <a href=\"https:\/\/bioinfo2.ugr.es\/biocomputacion\/preprocesar-smrna-seq\/\" class=\"read-more\">Read More &#8230;<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"_links":{"self":[{"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/pages\/2480"}],"collection":[{"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/comments?post=2480"}],"version-history":[{"count":5,"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/pages\/2480\/revisions"}],"predecessor-version":[{"id":2487,"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/pages\/2480\/revisions\/2487"}],"wp:attachment":[{"href":"https:\/\/bioinfo2.ugr.es\/biocomputacion\/wp-json\/wp\/v2\/media?parent=2480"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}