UCSC Genome Browser (Español)

La gran cantidad de datos sobre sistemas biológicos que se acumulan en la literatura hace necesario recopilar y digerir la información utilizando las herramientas de la bioinformática. El Navegador del Genoma de la UCSC presenta una colección diversa de conjuntos de datos de anotación (conocidos como «pistas» y presentados gráficamente), incluyendo alineaciones de ARNm, mapeos de elementos de repetición de ADN, predicciones de genes, datos de expresión de genes, datos de asociación de enfermedades (que representan las relaciones de los genes con las enfermedades) y mapeos de chips de genes disponibles comercialmente (por ejemplo, Illumina y Agilent). El paradigma básico de visualización es mostrar la secuencia del genoma en la dimensión horizontal, y mostrar representaciones gráficas de las localizaciones de los ARNm, predicciones de genes, etc. Los bloques de color a lo largo del eje de coordenadas muestran las ubicaciones de las alineaciones de los distintos tipos de datos. La capacidad de mostrar esta gran variedad de tipos de datos en un solo eje de coordenadas hace que el navegador sea una herramienta práctica para la integración vertical de los datos.

Para encontrar un gen o una región genómica específica, el usuario puede escribir el nombre del gen, una secuencia de ADN, un número de acceso para un ARN, el nombre de una banda citológica genómica (por ejemplo, 20p13 para la banda 13 en el brazo corto de la cr20) o una posición cromosómica (cr17:38.450.000-38.531.000 para la región que rodea al gen BRCA1).

La presentación de los datos en el formato gráfico permite que el navegador presente el acceso a la información detallada sobre cualquiera de las anotaciones. La página de detalles del gen del rastreo de Genes de la UCSC proporciona un gran número de enlaces a información más específica sobre el gen en muchos otros recursos de datos, como Online Mendelian Inheritance in Man (OMIM) y SwissProt.

Diseñado para la presentación de datos complejos y voluminosos, el UCSC Browser está optimizado para la velocidad. Al prealinear los 55 millones de ARN de GenBank con cada uno de los 81 ensamblajes del genoma (muchas de las 46 especies tienen más de un ensamblaje), el navegador permite el acceso instantáneo a los alineamientos de cualquier ARN con cualquiera de las especies alojadas.

Productos genéticos múltiples del gen FOXP2 (arriba) y conservación evolutiva mostrada en la alineación múltiple (abajo)

La yuxtaposición de los muchos tipos de datos permite a los investigadores mostrar exactamente la combinación de datos que responderá a preguntas específicas. Una funcionalidad de salida pdf/postscript permite exportar una imagen lista para la cámara para su publicación en revistas académicas.

Una característica única y útil que distingue al UCSC Browser de otros navegadores del genoma es la naturaleza continuamente variable de la pantalla. Se pueden mostrar secuencias de cualquier tamaño, desde una sola base de ADN hasta el cromosoma completo (chr1 humano = 245 millones de bases, Mb) con pistas de anotación completas. Los investigadores pueden visualizar un solo gen, un solo exón o una banda cromosómica completa, mostrando docenas o cientos de genes y cualquier combinación de las numerosas anotaciones. Una cómoda función de arrastre y zoom permite al usuario elegir cualquier región de la imagen del genoma y ampliarla para que ocupe toda la pantalla.

Los investigadores también pueden utilizar el navegador para mostrar sus propios datos a través de la herramienta Custom Tracks. Esta función permite a los usuarios cargar un archivo con sus propios datos y visualizarlos en el contexto del ensamblaje del genoma de referencia. Los usuarios también pueden utilizar los datos alojados por la UCSC, creando subconjuntos de los datos de su elección con la herramienta Table Browser (como sólo los SNPs que cambian la secuencia de aminoácidos de una proteína) y mostrar este subconjunto específico de los datos en el navegador como un Custom Track.

Cualquier vista del navegador creada por un usuario, incluyendo las que contienen Custom Tracks, puede ser compartida con otros usuarios a través de la herramienta Saved Sessions.

TracksEdit

Tracks del Navegador del Genoma UCSC

Debajo de la imagen mostrada del navegador del Genoma UCSC hay nueve categorías de pistas adicionales que pueden ser seleccionadas y mostradas junto a los datos originales. Estas categorías son Mapeo y Secuenciación, Genes y Predicciones Genéticas, Fenotipo y Literatura, ARNm y EST, Expresión, Regulación, Genómica Comparativa, Variación y Repeticiones.

Categorías
Categoría Descripción Ejemplos de pista
Mapeo y secuenciación Permite controlar el estilo de secuenciación mostrado. Posición de la base. Alt Map, Gap
Genes y predicciones de genes Qué programas predecir genes y qué bases de datos mostrar genes conocidos. GENCODE v24, Geneid Genes, Pfam en UCSC Gene Fenotipo y literatura Bases de datos que contienen estilos específicos de datos de fenotipo. Alelos OMIM, Cancer Gene Expr Super-track
ARNm y EST Acceso a ARNm y ESTs para búsquedas específicas en humanos o búsquedas generales de todo tipo. Est humanos, otros ESTs, otros mRNAs
Expresión Muestra expresiones únicas de secuencias predeterminadas. Gen GTEx, Affy U133
Regulación Información relevante a la regulación de transcripciones de diferentes estudios. Configuración de la Supervía de Regulación de ENCODE, ORegAnno
Genómica Comparativa Permite la comparación de la secuencia buscada con otros grupos de animales con genomas secuenciados. Conservación, Cons 7 Verts, Cons 30 Primates
Variación Compara la secuencia buscada con variaciones conocidas. SNPs comunes(150), Todos los SNPs(146), SNPs marcados(144)
Repeticiones Permite rastrear diferentes tipos de secuencias repetidas en la consulta. ReatMasker, Microsatélite, WM + SDust

Mapping and SequencingEdit

Estas pistas permiten el control del usuario sobre la visualización de las coordenadas genómicas, las secuencias y las brechas. Los investigadores tienen la capacidad de seleccionar las pistas que mejor representan su consulta para permitir que se muestren más datos aplicables en función del tipo y la profundidad de la investigación que se está realizando. Las pistas de mapeo y secuenciación también pueden mostrar una pista basada en el porcentaje para mostrar a un investigador si un elemento genético particular es más prevalente en el área especificada.

Genes y predicciones de genesEditar

Las pistas de genes y predicciones de genes controlan la visualización de los genes y sus partes posteriores. Las diferentes pistas permiten al usuario visualizar modelos de genes, regiones codificantes de proteínas y ARN no codificante, así como otros datos relacionados con los genes. Hay numerosas pistas disponibles que permiten a los investigadores comparar rápidamente su consulta con conjuntos de genes preseleccionados para buscar correlaciones entre conjuntos de genes conocidos.

Fenotipo y LiteraturaEditar

Las pistas de Fenotipo y Literatura se ocupan del fenotipo directamente vinculado con los genes, así como del fenotipo genético. Los usos de estas pistas están pensados para ser utilizados principalmente por médicos y otros profesionales relacionados con los trastornos genéticos, por investigadores en genética y por estudiantes avanzados de ciencia y medicina. Un investigador también puede mostrar una pista que muestre las posiciones genómicas de las variantes de aminoácidos naturales y artificiales.

ARNm y ESTEdit

Estas pistas están relacionadas con las etiquetas de secuencia expresada y el ARN mensajero. Las EST son secuencias de una sola lectura, normalmente de unas 500 bases de longitud, que suelen representar fragmentos de genes transcritos. Las pistas de ARNm permiten la visualización de datos de alineación de ARNm en humanos, así como en otras especies. También hay pistas que permiten la comparación con regiones de ESTs que muestran signos de splicing cuando se alinean con el genoma.

ExpressionEdit

Las pistas de expresión se utilizan para relacionar los datos genéticos con las áreas de tejido en las que se expresa. Esto permite a un investigador descubrir si un gen o secuencia en particular está vinculado con varios tejidos en todo el cuerpo. Las pistas de expresión también permiten mostrar datos de consenso sobre los tejidos que expresan la región de consulta.

RegulaciónEdit

Las pistas de regulación del navegador UCSC Genome son una categoría de pistas que controlan la representación de las regiones promotoras y de control dentro del genoma. Un investigador puede ajustar las pistas de regulación para añadir un gráfico de visualización al navegador del genoma. Estas visualizaciones permiten obtener más detalles sobre las regiones reguladoras, los sitios de unión de factores de transcripción, los sitios de unión de ARN, las variantes reguladoras, los haplotipos y otros elementos reguladores.

Genómica comparativaEditar

El navegador del genoma de la UCSC permite al usuario visualizar diferentes tipos de datos de conservación. El usuario puede seleccionar entre diferentes pistas incluyendo primates, vertebrados, mamíferos entre otros, y ver cómo la secuencia de genes que buscó se conserva entre otras especies. Los alineamientos comparativos ofrecen una visión gráfica de las relaciones evolutivas entre especies. Esto lo convierte en una herramienta útil tanto para el investigador, que puede visualizar regiones de conservación entre un grupo de especies y hacer predicciones sobre elementos funcionales en regiones de ADN desconocidas, como en el aula como herramienta para ilustrar uno de los argumentos más convincentes de la evolución de las especies. La pista comparativa de 44 vías en el ensamblaje humano muestra claramente que cuanto más se retrocede en el tiempo evolutivo, menos homología de secuencia queda, pero las regiones funcionalmente importantes del genoma (por ejemplo, los exones y los elementos de control, pero no los intrones típicamente) se conservan mucho más atrás en el tiempo evolutivo.

Datos de variaciónEditar

También se muestran muchos tipos de datos de variación. Por ejemplo, todo el contenido de cada versión de la base de datos dbSNP del NCBI se mapea a los genomas humanos, de ratón y otros. Esto incluye los frutos del Proyecto 1000 Genomas, tan pronto como se liberan en dbSNP. Otros tipos de datos de variación incluyen los datos de variación del número de copias (CNV) y las frecuencias alélicas de la población humana del proyecto HapMap.

RepeticionesEditar

Las pistas de repetición del navegador del genoma permiten al usuario ver una representación visual de las áreas de ADN con repeticiones de baja complejidad. Poder visualizar las repeticiones en una secuencia permite hacer inferencias rápidas sobre una consulta de búsqueda en el navegador del genoma. Un investigador tiene la posibilidad de ver rápidamente que su búsqueda especificada contiene grandes cantidades de secuencias repetidas de un vistazo y ajustar su búsqueda o las visualizaciones de las pistas en consecuencia.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *