UCSC Genome Browser (Italiano)

La grande quantità di dati sui sistemi biologici che si sta accumulando nella letteratura rende necessario raccogliere e digerire le informazioni utilizzando gli strumenti della bioinformatica. L’UCSC Genome Browser presenta una collezione diversificata di set di dati di annotazione (conosciuti come “tracce” e presentati graficamente), inclusi allineamenti di mRNA, mappature di elementi di ripetizione del DNA, predizioni di geni, dati di espressione genica, dati di associazione di malattie (che rappresentano le relazioni dei geni con le malattie), e mappature di chip genici disponibili in commercio (per esempio, Illumina e Agilent). Il paradigma di base della visualizzazione è quello di mostrare la sequenza del genoma nella dimensione orizzontale, e mostrare le rappresentazioni grafiche delle posizioni degli mRNA, le previsioni dei geni, ecc. I blocchi di colore lungo l’asse delle coordinate mostrano le posizioni degli allineamenti dei vari tipi di dati. La capacità di mostrare questa grande varietà di tipi di dati su un singolo asse di coordinate rende il browser uno strumento pratico per l’integrazione verticale dei dati.

Per trovare un gene specifico o una regione genomica, l’utente può digitare il nome del gene, una sequenza di DNA, un numero di adesione per un RNA, il nome di una banda citologica genomica (es, 20p13 per la banda 13 sul braccio corto di chr20) o una posizione cromosomica (chr17:38,450,000-38,531,000 per la regione intorno al gene BRCA1).

Presentare i dati in formato grafico permette al browser di presentare l’accesso tramite link a informazioni dettagliate su qualsiasi annotazione. La pagina dei dettagli del gene della traccia UCSC Genes fornisce un gran numero di link a informazioni più specifiche sul gene in molte altre risorse di dati, come Online Mendelian Inheritance in Man (OMIM) e SwissProt.

Progettato per la presentazione di dati complessi e voluminosi, il Browser UCSC è ottimizzato per la velocità. Preallineando i 55 milioni di RNA di GenBank a ciascuno degli 81 assemblaggi del genoma (molte delle 46 specie hanno più di un assemblaggio), il browser permette un accesso istantaneo agli allineamenti di qualsiasi RNA a qualsiasi specie ospitata.

Prodotti genici multipli del gene FOXP2 (in alto) e conservazione evolutiva mostrata nell’allineamento multiplo (in basso)

La giustapposizione dei molti tipi di dati permette ai ricercatori di visualizzare esattamente la combinazione di dati che risponderà a domande specifiche. Una funzionalità di output pdf/postscript permette l’esportazione di un’immagine pronta per la pubblicazione in riviste accademiche.

Una caratteristica unica e utile che distingue l’UCSC Browser da altri browser di genoma è la natura continuamente variabile della visualizzazione. Sequenze di qualsiasi dimensione possono essere visualizzate, da una singola base di DNA fino all’intero cromosoma (chr1 umano = 245 milioni di basi, Mb) con tracce di annotazione complete. I ricercatori possono visualizzare un singolo gene, un singolo esone o un’intera banda cromosomica, mostrando decine o centinaia di geni e qualsiasi combinazione delle molte annotazioni. Una comoda funzione di drag-and-zoom permette all’utente di scegliere qualsiasi regione nell’immagine del genoma e di espanderla per occupare l’intero schermo.

I ricercatori possono anche usare il browser per visualizzare i propri dati tramite lo strumento Tracce personalizzate. Questa funzione permette agli utenti di caricare un file con i propri dati e visualizzare i dati nel contesto dell’assemblaggio del genoma di riferimento. Gli utenti possono anche utilizzare i dati ospitati da UCSC, creando sottoinsiemi di dati a loro scelta con lo strumento Table Browser (come ad esempio solo gli SNPs che cambiano la sequenza di aminoacidi di una proteina) e visualizzare questo specifico sottoinsieme di dati nel browser come una Custom Track.

Tutte le viste del browser create da un utente, comprese quelle contenenti Custom Tracks, possono essere condivise con altri utenti attraverso lo strumento Saved Sessions.

TracksEdit

UCSC Genome Browser Tracks

Sotto l’immagine visualizzata dell’UCSC Genome browser ci sono nove categorie di tracce aggiuntive che possono essere selezionate e visualizzate accanto ai dati originali. Queste categorie sono Mappatura e Sequenziamento, Geni e Previsioni geniche, Fenotipo e Letteratura, mRNA ed EST, Espressione, Regolazione, Genomica comparativa, Variazione e Ripetizioni.

Categorie
Categoria Descrizione Esempi di traccia
Mappatura e sequenziamento Consente il controllo sullo stile di sequenziamento visualizzato. Posizione base. Alt Map, Gap
Geni e Previsioni Gene Quali programmi per prevedere i geni e quali banche dati per visualizzare i geni noti da. GENCODE v24, Geneid Genes, Pfam in UCSC Gene
Fenotipo e Letteratura Basi di dati contenenti stili specifici di dati fenotipici. OMIM Alleles, Cancer Gene Expr Super-track
mRNA e EST Accesso a mRNA e EST per ricerche specifiche sull’uomo o ricerche generali per tutti gli scopi. EST umane, altre EST, altri mRNA
Espressione Visualizza le espressioni uniche di sequenze predeterminate. GTEx Gene, Affy U133
Regolazione Informazioni relative alla regolazione delle trascrizioni da diversi studi. Regolazione ENCODE Super-track Impostazioni, ORegAnno
Genomica comparativa Consente il confronto della sequenza ricercata con altri gruppi di animali con genomi sequenziati. Conservazione, Cons 7 Verts, Cons 30 Primates
Variazione Compara la sequenza ricercata con variazioni note. SNPs comuni(150), Tutti gli SNPs(146), SNPs segnalati(144)
Ripetizioni Consente di tenere traccia dei diversi tipi di sequenze ripetute nella query. RepeatMasker, Microsatellite, WM + SDust

Mapping and SequencingEdit

Queste tracce permettono il controllo dell’utente sulla visualizzazione di coordinate genomiche, sequenze e lacune. I ricercatori hanno la possibilità di selezionare le tracce che meglio rappresentano la loro richiesta per consentire la visualizzazione di più dati applicabili a seconda del tipo e della profondità della ricerca. Le tracce di mappatura e sequenziamento possono anche visualizzare una traccia basata sulla percentuale per mostrare al ricercatore se un particolare elemento genetico è più prevalente nell’area specificata.

Gene and Gene PredictionsEdit

Le tracce gene e gene predictions controllano la visualizzazione dei geni e delle loro parti successive. Le diverse tracce permettono all’utente di visualizzare i modelli dei geni, le regioni codificanti le proteine e l’RNA non codificante, così come altri dati relativi ai geni. Ci sono numerose tracce disponibili che permettono ai ricercatori di confrontare rapidamente la loro query con insiemi preselezionati di geni per cercare correlazioni tra insiemi noti di geni.

Fenotipo e LetteraturaEdit

Le tracce Fenotipo e Letteratura trattano il fenotipo direttamente collegato ai geni così come il fenotipo genetico. Gli usi di queste tracce sono destinati ad essere utilizzati principalmente da medici e altri professionisti che si occupano di disturbi genetici, da ricercatori di genetica e da studenti avanzati in scienze e medicina. Un ricercatore può anche visualizzare una traccia che mostra le posizioni genomiche delle varianti naturali e artificiali degli aminoacidi.

mRNA e ESTEdit

Queste tracce sono relative ai tag di sequenza espressi e all’RNA messaggero. Gli EST sono sequenze a lettura singola, tipicamente di circa 500 basi di lunghezza, che di solito rappresentano frammenti di geni trascritti. Le tracce dell’mRNA permettono di visualizzare i dati di allineamento dell’mRNA nell’uomo e in altre specie. Ci sono anche tracce che permettono il confronto con regioni di EST che mostrano segni di splicing quando allineate con il genoma.

ExpressionEdit

Le tracce di espressione sono usate per mettere in relazione i dati genetici con le aree di tessuto in cui sono espressi. Questo permette ad un ricercatore di scoprire se un particolare gene o sequenza è collegato a vari tessuti in tutto il corpo. Le tracce di espressione permettono anche di visualizzare i dati di consenso sui tessuti che esprimono la regione di query.

RegulationEdit

Le tracce di regolazione dell’UCSC Genome browser sono una categoria di tracce che controllano la rappresentazione delle regioni promotrici e di controllo all’interno del genoma. Un ricercatore può regolare le tracce di regolazione per aggiungere un grafico di visualizzazione al browser del genoma. Queste visualizzazioni permettono di avere maggiori dettagli sulle regioni di regolazione, i siti di legame dei fattori di trascrizione, i siti di legame dell’RNA, le varianti di regolazione, gli aplotipi e altri elementi di regolazione.

Comparative GenomicsEdit

L’UCSC Genome Browser permette all’utente di visualizzare diversi tipi di dati di conservazione. L’utente può selezionare da diverse tracce tra cui primati, vertebrati, mammiferi tra gli altri, e vedere come la sequenza del gene che ha cercato è conservata tra le altre specie. Gli allineamenti comparativi danno una visione grafica delle relazioni evolutive tra le specie. Questo lo rende uno strumento utile sia per il ricercatore, che può visualizzare le regioni di conservazione tra un gruppo di specie e fare previsioni sugli elementi funzionali nelle regioni sconosciute del DNA, sia in classe come strumento per illustrare uno degli argomenti più convincenti per l’evoluzione delle specie. La traccia comparativa a 44 vie sull’assemblaggio umano mostra chiaramente che più si va indietro nel tempo evolutivo, meno omologia di sequenza rimane, ma regioni funzionalmente importanti del genoma (ad esempio, esoni ed elementi di controllo, ma non introni in genere) sono conservati molto più indietro nel tempo evolutivo.

Dati di variazioneModifica

Vengono visualizzati anche molti tipi di dati di variazione. Per esempio, l’intero contenuto di ogni versione del database dbSNP dell’NCBI è mappato su genomi umani, topi e altri genomi. Questo include i frutti del Progetto 1000 Genomi, non appena vengono rilasciati in dbSNP. Altri tipi di dati di variazione includono i dati di variazione del numero di copie (CNV) e le frequenze alleliche della popolazione umana dal progetto HapMap.

RepeatsEdit

Le tracce di ripetizione del browser del genoma permettono all’utente di vedere una rappresentazione visiva delle aree del DNA con ripetizioni di bassa complessità. Essere in grado di visualizzare le ripetizioni in una sequenza permette di fare rapide inferenze su una query di ricerca nel browser del genoma. Un ricercatore ha il potenziale per vedere rapidamente che la sua ricerca specificata contiene grandi quantità di sequenze ripetute a colpo d’occhio e regolare la sua ricerca o la visualizzazione delle tracce di conseguenza.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *