UCSC Genome Browser

De grote hoeveelheid gegevens over biologische systemen die zich in de literatuur opstapelt, maakt het noodzakelijk informatie te verzamelen en te verwerken met behulp van de hulpmiddelen van de bio-informatica. De UCSC Genome Browser presenteert een diverse verzameling annotatie datasets (bekend als “tracks” en grafisch gepresenteerd), waaronder mRNA-uitlijningen, mappings van DNA-repeat-elementen, genvoorspellingen, gen-expressiegegevens, ziekteassociatiegegevens (die de relaties van genen met ziekten weergeven), en mappings van commercieel beschikbare gen-chips (bv. Illumina en Agilent). Het basisparadigma van de weergave is de genoomsequentie te tonen in de horizontale dimensie, en grafische voorstellingen te geven van de locaties van de mRNA’s, genvoorspellingen, enz. Kleurblokken langs de coördinatenas tonen de locaties van de uitlijningen van de verschillende gegevenstypen. De mogelijkheid om deze grote verscheidenheid van gegevenstypen op een enkele coördinatenas weer te geven, maakt de browser tot een handig hulpmiddel voor de verticale integratie van de gegevens.

Om een specifiek gen of genomische regio te vinden, kan de gebruiker de naam van het gen, een DNA-sequentie, een toetredingsnummer voor een RNA, de naam van een genomische cytologische band (b.v, 20p13 voor band 13 op de korte arm van chr20) of een chromosomale positie (chr17:38,450,000-38,531,000 voor de regio rond het gen BRCA1).

Door de gegevens in een grafisch formaat te presenteren, kan de browser via links toegang geven tot gedetailleerde informatie over elk van de annotaties. De gen-detailpagina van de UCSC Genen track biedt een groot aantal links naar meer specifieke informatie over het gen bij vele andere gegevensbronnen, zoals Online Mendelian Inheritance in Man (OMIM) en SwissProt.

Ontworpen voor de presentatie van complexe en omvangrijke gegevens, is de UCSC Browser geoptimaliseerd voor snelheid. Door de 55 miljoen RNA’s van GenBank vooraf uit te lijnen op elk van de 81 genoomassemblages (veel van de 46 soorten hebben meer dan één assemblage), biedt de browser onmiddellijke toegang tot de uitlijningen van elk RNA op elk van de gehoste soorten.

Meerdere genproducten van het FOXP2-gen (boven) en evolutionair behoud getoond in meervoudige uitlijning (onder)

Door de vele soorten gegevens naast elkaar te zetten, kunnen onderzoekers precies die combinatie van gegevens weergeven die specifieke vragen zal beantwoorden. Een pdf/postscript uitvoerfunctionaliteit maakt het exporteren van een cameraklaar beeld voor publicatie in academische tijdschriften mogelijk.

Een unieke en nuttige functie die de UCSC Browser onderscheidt van andere genoombrowsers is het continu variabele karakter van de weergave. Sequenties van elke grootte kunnen worden weergegeven, van een enkele DNA base tot het volledige chromosoom (menselijke chr1 = 245 miljoen basen, Mb) met volledige annotatie tracks. Onderzoekers kunnen een enkel gen, een enkel exon of een volledige chromosomenband weergeven, waarbij tientallen of honderden genen en elke combinatie van de vele annotaties worden getoond. Een handige drag-and-zoom functie stelt de gebruiker in staat om een regio in het genoom-beeld te kiezen en het uit te vouwen om het volledige scherm in beslag te nemen.

Onderzoekers kunnen de browser ook gebruiken om hun eigen gegevens weer te geven via de Custom Tracks tool. Met deze functie kunnen gebruikers een bestand met hun eigen gegevens uploaden en de gegevens bekijken in de context van de referentie-genoomassemblage. Gebruikers kunnen ook gebruik maken van de door UCSC gehoste data, en met de Table Browser tool subsets van de data van hun keuze maken (zoals alleen de SNPs die de aminozuursequentie van een eiwit veranderen) en deze specifieke subset van de data in de browser als een Custom Track weergeven.

Elke door een gebruiker gemaakte browser view, inclusief die met Custom Tracks, kan met andere gebruikers worden gedeeld via de Saved Sessions tool.

TracksEdit

UCSC Genome Browser Tracks

Onder het getoonde beeld van de UCSC Genome Browser staan negen categorieën aanvullende sporen die kunnen worden geselecteerd en naast de originele gegevens kunnen worden weergegeven. Deze categorieën zijn Mapping and Sequencing, Genes and Gene Predictions, Phenotype and Literature, mRNA and EST, Expression, Regulation, Comparative Genomics, Variation, en Repeats.

Expressie

Categorieën
Categorie Beschrijving Voorbeelden van track
Mapping en Sequencing Maakt het mogelijk de stijl van de weergegeven sequencing te bepalen. Basispositie. Alt Map, Gap
Genen en Genvoorspellingen Welke programma’s om genen te voorspellen en uit welke databases bekende genen worden weergegeven. GENCODE v24, Geneid Genen, Pfam in UCSC Gene
Fenotype en Literatuur Databases die specifieke stijlen van fenotype gegevens bevatten. OMIM Alleles, Cancer Gene Expr Super-track
mRNA en EST Toegang tot mRNA’s en EST’s voor mens-specifieke zoekopdrachten of algemene all purpose zoekopdrachten. Menselijke EST’s, Andere EST’s, Andere mRNA’s
Laat unieke expressies zien van vooraf bepaalde sequenties. GTEx-gen, Affy U133
Regulatie Informatie die relevant is voor de regulatie van transcripties uit verschillende studies. ENCODE Regulation Super-track Settings, ORegAnno
Comparative Genomics Maakt de vergelijking mogelijk van de gezochte sequentie met andere groepen dieren met gesequenseerde genomen. Conservering, Cons 7 Verts, Cons 30 Primaten
Variatie Vergelijkt de gezochte sequentie met bekende variaties. Gemeenschappelijke SNP’s(150), Alle SNP’s(146), Gemarkeerde SNP’s(144)
Variaties Maken het mogelijk om verschillende soorten herhaalde sequenties in de query te traceren. RepeatsMasker, Microsatelliet, WM + SDust

Mapping and SequencingEdit

Deze sporen bieden de gebruiker controle over de weergave van genomische coördinaten, sequenties, en hiaten. Onderzoekers hebben de mogelijkheid om tracks te selecteren die het beste hun query vertegenwoordigen, zodat meer toepasbare gegevens kunnen worden weergegeven, afhankelijk van het type en de diepgang van het onderzoek dat wordt gedaan. De mapping en sequencing tracks kunnen ook een percentage-gebaseerde track weergeven om een onderzoeker te laten zien of een bepaald genetisch element meer voorkomt in het gespecificeerde gebied.

Genen en genvoorspellingenEdit

De gen en genvoorspellingen tracks regelen de weergave van genen en hun opvolgende delen. De verschillende sporen stellen de gebruiker in staat genmodellen, eiwitcoderende regio’s en niet-coderend RNA weer te geven, evenals andere gen-gerelateerde gegevens. Er zijn talrijke tracks beschikbaar waarmee onderzoekers snel hun query kunnen vergelijken met vooraf geselecteerde sets van genen om te zoeken naar correlaties tussen bekende sets van genen.

Fenotype en LiteratuurEdit

Phenotype en Literatuur tracks gaan over fenotype dat direct gekoppeld is aan genen, maar ook over genetisch fenotype. Het gebruik van deze tracks is in de eerste plaats bedoeld voor gebruik door artsen en andere professionals die zich bezighouden met genetische aandoeningen, door genetica onderzoekers, en door gevorderde studenten in de wetenschap en geneeskunde. Een onderzoeker kan ook een spoor weergeven dat de genomische posities van natuurlijke en kunstmatige aminozuurvarianten laat zien.

mRNA en ESTEdit

Deze sporen hebben betrekking op expressed sequence tags en messenger RNA. EST’s zijn single-read sequenties, meestal ongeveer 500 basen lang, die meestal fragmenten van getranscribeerde genen vertegenwoordigen. De mRNA-sporen maken de weergave mogelijk van mRNA-uitlijningsgegevens van mensen en andere soorten. Er zijn ook tracks die vergelijking mogelijk maken met regio’s van EST’s die tekenen van splitsing vertonen wanneer ze zijn uitgelijnd met het genoom.

ExpressionEdit

Expression tracks worden gebruikt om genetische gegevens te relateren aan de weefselgebieden waarin ze tot expressie komen. Dit stelt een onderzoeker in staat te ontdekken of een bepaald gen of een bepaalde sequentie is gekoppeld aan verschillende weefsels in het lichaam. De expressiesporen maken het ook mogelijk om consensusgegevens weer te geven over de weefsels die het gezochte gebied tot expressie brengen.

RegulatieEdit

De regulatiesporen van de UCSC Genome browser zijn een categorie sporen die de weergave van promotor- en regelregio’s binnen het genoom regelen. Een onderzoeker kan de regulatiesporen aanpassen om een weergavegrafiek aan de genoom-browser toe te voegen. Deze weergaven maken meer detail mogelijk over regulatorische regio’s, bindingsplaatsen voor transcriptiefactoren, RNA-bindingsplaatsen, regulatorische varianten, haplotypes en andere regulatorische elementen.

Comparative GenomicsEdit

De UCSC Genome Browser stelt de gebruiker in staat om verschillende soorten conserveringsgegevens weer te geven. De gebruiker kan kiezen uit verschillende sporen, waaronder primaten, gewervelden, zoogdieren en andere, en zien hoe de gensequentie die hij heeft gezocht is geconserveerd onder andere soorten. De vergelijkende alignementen geven een grafisch beeld van de evolutionaire relaties tussen soorten. Dit maakt het een nuttig instrument zowel voor de onderzoeker, die gebieden van behoud tussen een groep van soorten kan visualiseren en voorspellingen kan doen over functionele elementen in onbekende DNA-gebieden, als in de klas als een hulpmiddel om een van de meest dwingende argumenten voor de evolutie van soorten te illustreren. De 44-weg vergelijkende track op de menselijke assemblage laat duidelijk zien dat hoe verder men terug gaat in evolutionaire tijd, hoe minder sequentie homologie overblijft, maar functioneel belangrijke regio’s van het genoom (bijvoorbeeld exonen en controle-elementen, maar meestal niet introns) zijn geconserveerd veel verder terug in evolutionaire tijd.

Variatie dataEdit

Vele soorten van variatie data worden ook weergegeven. Zo wordt bijvoorbeeld de volledige inhoud van elke versie van de dbSNP-database van NCBI in kaart gebracht voor menselijke, muis- en andere genomen. Dit omvat de vruchten van het 1000 Genomes Project, zodra deze worden vrijgegeven in dbSNP. Andere soorten variatiegegevens zijn onder andere copy-number variation data (CNV) en menselijke populatie allel frequenties uit het HapMap project.

HerhalingenEdit

De herhalingssporen van de genoom-browser stellen de gebruiker in staat om een visuele weergave te zien van de DNA-gebieden met herhalingen van lage complexiteit. Het kunnen visualiseren van herhalingen in een sequentie maakt het mogelijk snel conclusies te trekken over een zoekopdracht in de genoom-browser. Een onderzoeker kan in één oogopslag zien dat zijn zoekopdracht grote hoeveelheden herhaalde sequenties bevat en zijn zoek- of trackweergaven dienovereenkomstig aanpassen.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *