A grande quantidade de dados sobre sistemas biológicos que se acumula na literatura torna necessário recolher e digerir informação usando as ferramentas da bioinformática. O UCSC Genome Browser apresenta uma recolha diversificada de conjuntos de dados de anotação (conhecidos como “pistas” e apresentados graficamente), incluindo alinhamentos de mRNA, mapeamentos de elementos de repetição de DNA, previsões de genes, dados de expressão de genes, dados de associação de doenças (representando as relações dos genes com as doenças), e mapeamentos de chips de genes disponíveis comercialmente (por exemplo, Illumina e Agilent). O paradigma básico de exibição é mostrar a sequência do genoma na dimensão horizontal, e mostrar representações gráficas das localizações dos mRNAs, previsões de genes, etc. Os blocos de cor ao longo do eixo de coordenadas mostram as localizações dos alinhamentos dos vários tipos de dados. A capacidade de mostrar esta grande variedade de tipos de dados num único eixo de coordenadas torna o navegador uma ferramenta útil para a integração vertical dos dados.
Para encontrar um gene ou região genómica específica, o utilizador pode digitar o nome do gene, uma sequência de ADN, um número de acesso para um RNA, o nome de uma banda citológica genómica (por exemplo 20p13 para a banda 13 no braço curto de chr20) ou uma posição cromossómica (chr17:38,450,000-38,531,000 para a região em redor do gene BRCA1).
Apresentar os dados no formato gráfico permite ao navegador apresentar o acesso a informações detalhadas sobre qualquer uma das anotações. A página de detalhes do gene da pista Genes UCSC fornece um grande número de ligações a informações mais específicas sobre o gene em muitos outros recursos de dados, tais como Online Mendelian Inheritance in Man (OMIM) e SwissProt.
Desenhado para a apresentação de dados complexos e volumosos, o Navegador UCSC está optimizado para a velocidade. Ao pré-alinhar os 55 milhões de RNAs do GenBank para cada um dos 81 conjuntos de genoma (muitas das 46 espécies têm mais do que um conjunto), o navegador permite o acesso instantâneo aos alinhamentos de qualquer RNA a qualquer uma das espécies hospedadas.
A justaposição dos muitos tipos de dados permite aos investigadores mostrar exactamente a combinação de dados que irão responder a perguntas específicas. Uma funcionalidade de saída pdf/postscript permite a exportação de uma imagem pronta para a câmara para publicação em revistas académicas.
Uma característica única e útil que distingue o Navegador UCSC de outros navegadores do genoma é a natureza continuamente variável da exibição. É possível exibir sequências de qualquer tamanho, desde uma única base de ADN até ao cromossoma inteiro (chr1 humano = 245 milhões de bases, Mb) com faixas de anotação completas. Os investigadores podem exibir um único gene, um único exão, ou uma banda cromossómica inteira, mostrando dezenas ou centenas de genes e qualquer combinação das muitas anotações. Uma característica conveniente de arrastar e fazer zoom permite ao utilizador escolher qualquer região na imagem do genoma e expandi-la para ocupar o ecrã completo.
Os investigadores podem também utilizar o navegador para exibir os seus próprios dados através da ferramenta de Rastos Personalizados. Esta característica permite aos utilizadores carregar um ficheiro com os seus próprios dados e visualizar os dados no contexto da montagem do genoma de referência. Os utilizadores também podem utilizar os dados alojados pela UCSC, criando subconjuntos dos dados da sua escolha com a ferramenta Table Browser (como apenas os SNPs que alteram a sequência de aminoácidos de uma proteína) e exibir este subconjunto específico dos dados no browser como uma Faixa Personalizada.
Ainda vista do browser criada por um utilizador, incluindo as que contêm Faixas Personalizadas, pode ser partilhada com outros utilizadores através da ferramenta Sessões Guardadas.
TracksEdit
/div>
Below a imagem exibida do navegador do Genoma UCSC são nove categorias de faixas adicionais que podem ser seleccionadas e exibidas juntamente com os dados originais. Estas categorias são Mapeamento e Sequenciação, Genes e Previsões Genéticas, Fenótipo e Literatura, mRNA e EST, Expressão, Regulação, Genómica Comparativa, Variação, e Repetições.
Category | Descrição | Exemplos de pista |
---|---|---|
Mapping and Sequencing | Permite o controlo sobre o estilo de sequenciação apresentado. | Posição Base. Alt Map, Gap |
Que programas prever genes e que bases de dados exibir genes conhecidos de. | GENCODE v24, Geneid Genes, Pfam em UCSC Gene | |
Fenótipo e Literatura | Bases de dados contendo estilos específicos de dados fenotípicos. | OMIM Alleles, Cancer Gene Expr Super-track |
mRNA e EST | Acesso a mRNAs e ESTs para buscas específicas humanas ou buscas gerais para todos os fins. | ESTs humanos, Outros ESTs, Outros mRNAs |
Expressão | Exibir expressões únicas de sequências pré-determinadas. | GTEx Gene, Affy U133 |
Regulamento | Informação relevante para a regulação de transcrições de diferentes estudos. | ENCODE Regulation Super-track Settings, ORegAnno |
Comparative Genomics | Permite a comparação da sequência pesquisada com outros grupos de animais com genomas sequenciados. | Conservação, Cons 7 Versões, Cons 30 Primatas |
Variação | Comparar a sequência pesquisada com variações conhecidas. | SNPs comuns(150), Todos os SNPs(146), SNPs assinalados(144) |
Repetições | Permite o seguimento de diferentes tipos de sequências repetidas na consulta. | RepeatMasker, Microsatellite, WM + SDust |
Mapping and SequencingEdit
Estas pistas permitem o controlo do utilizador sobre a exibição de coordenadas genómicas, sequências, e lacunas. Os investigadores têm a capacidade de seleccionar as pistas que melhor representam a sua consulta para permitir a exibição de dados mais aplicáveis, dependendo do tipo e profundidade da investigação a ser feita. As pistas de mapeamento e sequenciação podem também exibir uma pista baseada em percentagem para mostrar a um investigador se um determinado elemento genético for mais prevalecente na área especificada.
Genes and Gene PredictionsEdit
As pistas de previsão genética e genética controlam a exibição dos genes e das suas partes subsequentes. As diferentes pistas permitem ao utilizador exibir modelos de genes, regiões codificadoras de proteínas, e RNA não codificante, bem como outros dados relacionados com genes. Existem numerosas pistas disponíveis que permitem aos investigadores comparar rapidamente a sua consulta com conjuntos de genes pré-seleccionados para procurar correlações entre conjuntos de genes conhecidos.
Fenótipo e LiteraturaEditar
Fenótipo e Literatura pistas lidam com fenótipo directamente ligado a genes, bem como com fenótipo genético. As utilizações destas faixas destinam-se principalmente a médicos e outros profissionais preocupados com doenças genéticas, por investigadores em genética, e por estudantes avançados em ciência e medicina. Um investigador pode também exibir uma faixa que mostra as posições genómicas das variantes de aminoácidos naturais e artificiais.
mRNA e ESTEdit
Estas faixas estão relacionadas com marcas de sequência expressas e RNA do mensageiro. ESTs são sequências de leitura única, tipicamente com cerca de 500 bases de comprimento, que normalmente representam fragmentos de genes transcritos. As pistas de mRNA permitem a exibição de dados de alinhamento de mRNA em Humanos, bem como, de outras espécies. Há também faixas que permitem a comparação com regiões de ESTs que mostram sinais de emenda quando alinhadas com o genoma.
ExpressionEdit
As faixas de expressão são usadas para relacionar dados genéticos com as áreas de tecido em que são expressas. Isto permite a um investigador descobrir se um determinado gene ou sequência está ligado a vários tecidos em todo o corpo. As pistas de expressão também permitem a exibição de dados consensuais sobre os tecidos que expressam a região de consulta.
RegulationEdit
As pistas de regulação do navegador do genoma da UCSC são uma categoria de pistas que controlam a representação das regiões promotoras e de controlo dentro do genoma. Um pesquisador pode ajustar as faixas de regulação para adicionar um gráfico de visualização ao navegador do genoma. Estes mostradores permitem mais detalhes sobre regiões reguladoras, sítios de ligação do factor de transcrição, sítios de ligação do RNA, variantes reguladoras, haplótipos, e outros elementos reguladores.
GenomicsEditar Comparativo
O Navegador de Genoma da UCSC permite ao utilizador exibir diferentes tipos de dados de conservação. O utilizador pode seleccionar a partir de diferentes pistas, incluindo primatas, vertebrados, mamíferos entre outros, e ver como a sequência genética que pesquisou é conservada entre outras espécies. Os alinhamentos comparativos dão uma visão gráfica das relações evolutivas entre as espécies. Isto torna-a uma ferramenta útil tanto para o investigador, que pode visualizar regiões de conservação entre um grupo de espécies e fazer previsões sobre elementos funcionais em regiões desconhecidas de ADN, como na sala de aula como uma ferramenta para ilustrar um dos argumentos mais convincentes para a evolução das espécies. A pista comparativa de 44 vias na montagem humana mostra claramente que quanto mais se recua no tempo evolutivo, menos homologia de sequência permanece, mas regiões funcionalmente importantes do genoma (por exemplo, exons e elementos de controlo, mas não introns tipicamente) são conservadas muito mais atrás no tempo evolutivo.
Dados de variaçãoEditar
Muitos tipos de dados de variação também são exibidos. Por exemplo, todo o conteúdo de cada lançamento da base de dados dbSNP da NCBI é mapeado para humanos, ratos e outros genomas. Isto inclui os frutos do Projecto 1000 Genomes, assim que estes são lançados no dbSNP. Outros tipos de dados de variação incluem dados de variação do número de cópias (CNV) e frequências de alelos da população humana do projecto HapMap.
RepeatsEdit
As pistas de repetição do navegador do genoma permitem ao utilizador ver uma representação visual das áreas de ADN com repetições de baixa complexidade. Ser capaz de visualizar repetições numa sequência permite inferências rápidas sobre uma consulta de pesquisa no navegador do genoma. Um pesquisador tem o potencial de ver rapidamente que a sua pesquisa especificada contém grandes quantidades de sequências repetidas num relance e ajustar as suas visualizações de pesquisa ou faixa em conformidade.