Session 5 RI Bioinformatics Tools and Resources In this session we introduce some bioinformatics tools and resources for sequence analysis. The file seqs.fa contains a list of numbered sequences of bacterial genomes. Each student has to study the sequence numbered according to the length of the alphabet used in the first session. COMPARISON OF SMALL SEQUENCES - Connect to http://alggen.lsi.ucp.edu --> Downloaded Tools -> DOTLET - Examine the structure of sequences SEQDOTLET1,...,SEQDOTLET3. Do you see any notable feature that make them not random? How similar they are? COMPARISON OF LARGE SEQUENCES Download MGCAT from alggen.lsi.upc.edu/research/align and some genomes from my web page. Execute MGCAT. Hints for Windows: once the file had been uncompressed, register the complete path of the subdir ./tcl/tcl8.4/ in the system variable TCL_LIBRARY BLAST Allows fuzzy searches over all of the genome database. * Connect to NCBI (http://www.ncbi.nlm.nih.gov/) . * Sequence Identification / BLAST In this case, we know that our sequences are from bacterial genomes, then we use a version adapted to search in microbial genomes. Observe that from the web page the entire genome can be downloaded. Homework: In the second lab session I gave you a number for the size of the alphabet.Take the corresponding sequence into de file Seqs.fa of my RI web page and: i) Examine the sequence with DOTLET. See something remarkable? ii) Blast de sequence and search for the genome to which it belongs. iii) Download the corresponding genome and some others close to it and compare all them with MGCAT. The report should contains a screen captures of the programs running with your sequence. -------------------------------------------------------------- (Feu cas de la versio en angles) Sessio 5 de RI Eines i Recursos Bioinformatics En aquesta sessio veurem i provarem algunes eines bioinformatiques per a l'analisis de sequencies aixi com les bases de dades de referencia per a informacio genomica. Al fitxer seqs.fa hi trobareu un llistat de sequencies numerades que corresponen a genomes bacterians. A cada ESTUDIANT li correspon la sequencia numerada segons la longitud de l'alfabet usat en la quarta sessio. COMPARACIO DE SEQUENCIES CURTES - Conecteu a http://alggen.lsi.ucp.edu i accediu a Downloaded Tools -> DOTLET - Examineu l'estructura de les sequencies SEQDOTLET1 i SEQDOTLET2. Creieu que tenen alguna caracteristica destacable que les faci no aleatories? Quina us sembla que pot ser? Feina per casa: - quina relacio hi ha entre SEQDOTLET1 i SEQDOTLET2 amb SEQDOTLET3 i SEQDOTLET4. - * Estudieu l'estructura basica de la sequencia que us toca de la llista. COMPARACIO DE SEQUENCIES LLARGUES Baixeu-vos MGCAT, els dos genomes i executeu-lo. BLAST Permet fer cerques aproximades sobre tots els genomes de la base de dades. * Conecteu a NCBI (http://www.ncbi.nlm.nih.gov/) i exploreu algunes de les opcions que us ofereix. * Identificacio de sequencies/BLAST En aquest cas, com que sabem que les nostres sequencies provenen de genomes bacterians, utilitzarem una versio adaptada a la cerca en genomes microbians. - Aneu a l'apartat de "Sequence analysis", accediu a BLAST i seleccioneu "Microbes". - Enganxeu la sequencia a la caixa corresponent, seleccioneu els organismes sobre els que voleu cercar (per exemple tots), i cliqueu a BLAST. - A la pagina de resultats us apareixeran un o mes organismes en els que s'han trobat sequencies semblants a la vostra i la informacio de l'alineament corresponent. - Per a aquesta practica, assumirem que el primer organisme de la llista es efectivament el que busquem i sera  amb el que treballareu. - Observeu la sortida del BLAST anterior. La vostra sequencia forma part d'alguna "Feature" del bacteri? Examineu la seva sequencia (nomes de la feature, NO el genoma complet!) amb DOTLET. Veieu alguna cosa destacable? - Baixeu la sequencia genomica de del vostre bacteri aixi com de 3 bacteris mes (si podeu, almenys un de molt proper). Per a saber de quins bacteris hi ha sequencies genomiques completes podeu mirar a ftp://ftp.ncbi.nih.gov/genomes/ i accedir a "bacteria". - Compareu els genomes amb MGCAT. Que en podeu dir? Que cal entregar? * Cal entregar un petit informe que contingui: - El resultat de BLAST i el nom del vostre bacteri - Les imatges de les execucions de dotlet (almenys imatges parcials) amb les conclusions que en pogueu treure - Les captures de pantalla de les execucions de MGCAT amb les conclusions que en pogueu treure.