文献に蓄積されている生物システムに関する大量のデータは、バイオインフォマティクスのツールを使って情報を収集し、消化する必要があります。 UCSC Genome Browserでは、mRNAのアラインメント、DNAリピート要素のマッピング、遺伝子予測、遺伝子発現データ、疾患関連データ(遺伝子と疾患との関係を表す)、市販の遺伝子チップ(IlluminaやAgilentなど)のマッピングなど、多様なアノテーションデータセット(「トラック」と呼ばれ、グラフィカルに表示されます)が表示されます。 表示の基本的なパラダイムは、横方向にゲノム配列を表示し、mRNAの位置や遺伝子予測などをグラフィカルに表現することです。 座標軸に沿った色のブロックは、様々なデータタイプのアラインメントの位置を示しています。
特定の遺伝子やゲノム領域を検索するには、ユーザーは遺伝子名、DNA配列、RNAのアクセッション番号、ゲノムの細胞学的バンド名(例:20p13はバンド13)などを入力します。
データをグラフィカルな形式で表示することで、どのアノテーションについても詳細な情報へのリンクをブラウザで表示することができます。
複雑で膨大なデータを表示するために設計された UCSC Browser は、スピードを重視しています。 GenBank の 5,500 万本の RNA を 81 のゲノムアセンブリそれぞれに事前にアラインしておくことで(46 種の多くは複数のアセンブリを持っています)、このブラウザでは、ホストされているすべての種に対するあらゆる RNA のアラインメントに即座にアクセスすることができます。
多くの種類のデータが並置されているため、研究者は特定の質問に答えるデータの組み合わせを正確に表示することができます。
UCSC Browserが他のゲノムブラウザと異なるユニークで便利な機能の一つは、表示が連続的に変化することです。 単一の DNA 塩基から染色体全体 (ヒトの chr1 = 2 億 4500 万塩基、Mb) まで、あらゆるサイズの配列を完全なアノテーション トラック付きで表示できます。 研究者は、1つの遺伝子、1つのエクソン、または染色体全体を表示することができ、数十から数百の遺伝子と多くのアノテーションの組み合わせを表示することができます。
研究者は、Custom Tracksツールを使って、独自のデータをブラウザに表示することもできます。
また、「Custom Tracks」というツールを使って、自分のデータを表示することもできます。この機能では、自分のデータのファイルをアップロードして、参照ゲノムアセンブリのコンテキストでデータを表示できます。
ユーザーが作成したブラウザビューは、カスタムトラックを含むものも含めて、Saved Sessions ツールを使って他のユーザーと共有することができます。
TracksEdit
div
UCSC Genome Browserの表示画像の下には、9つのカテゴリーの追加トラックがあり、選択して元のデータと一緒に表示することができます。 これらのカテゴリーは、Mapping and Sequencing、Genes and Gene Predictions、Phenotype and Literature、mRNA and EST、Expression, Regulation、Comparative Genomics、Variation、Repeatsです。
カテゴリー | 説明 | トラックの例 |
---|---|---|
マッピングとシークエンス | 表示されるシークエンスのスタイルをコントロールできます。 | ベースポジション。 |
遺伝子と遺伝子予測 | 遺伝子を予測するプログラムと既知の遺伝子を表示するデータベース | GENCODE v24, Geneid Genes, Pfam in UCSC Gene |
Phenotype and Literature | 表現型データの特定のスタイルを含むデータベース。 | OMIM Alleles, Cancer Gene Expr Super-track |
mRNA and EST | mRNAやESTにアクセスして、ヒトに特化した検索や汎用的な検索を行うことができます。 | Human ESTs, Other ESTs, Other mRNAs |
Expression | 所定の配列のユニークな発現を表示する。 | GTEx Gene, Affy U133 |
Regulation | 転写の制御に関連する情報を様々な研究から得ることができる。 | ENCODE Regulation Super-track Settings, ORegAnno |
Comparative Genomics | 検索された配列を、ゲノム配列のある他の動物グループと比較することができます。 | Conservation, Cons 7 Verts, Cons 30 Primates |
Variation | 検索された配列を既知のバリエーションと比較します。 | Common SNPs(150), All SNPs(146), Flagged SNPs(144) |
Repeats | クエリ内の様々な種類の繰り返し配列を追跡することができます。 | RepeatMasker, Microsatellite, WM + SDust |
Mapping and SequencingEdit
これらのトラックは、ゲノムの座標、配列、およびギャップの表示をユーザーがコントロールすることができます。 研究者は、研究の種類と深さに応じて、より適用可能なデータを表示するために、クエリを最もよく表すトラックを選択することができます。
Genes and Gene PredictionsEdit
Gene and gene predictions tracks は、遺伝子とそれに続く部分の表示を制御します。 様々なトラックにより、ユーザーは遺伝子モデル、タンパク質コーディング領域、ノンコーディングRNA、およびその他の遺伝子関連データを表示することができます。
Phenotype and LiteratureEdit
Phenotype and Literature tracks は、遺伝子に直接関連する表現型と、遺伝的表現型を扱います。 これらのトラックの用途は、主に遺伝子疾患に関わる医師などの専門家、遺伝学の研究者、科学や医学の上級生が使用することを目的としています。
mRNA and ESTEdit
これらのトラックは、expressed sequence tagsとmessenger RNAに関連しています。 ESTは、通常500塩基程度の長さのシングルリードの配列で、通常は転写された遺伝子の断片を表します。 mRNAトラックでは、ヒトだけでなく他の生物種のmRNAのアラインメントデータを表示することができます。
ExpressionEdit
Expressionトラックは、遺伝子データとそれが発現している組織領域を関連付けるために使用されます。 これにより、研究者は、特定の遺伝子や配列が体全体の様々な組織と関連しているかどうかを発見することができます。
RegulationEdit
UCSC Genome Browser のレギュレーション トラックは、ゲノム内のプロモーターや制御領域の表現を制御するトラックのカテゴリです。 研究者はレギュレーショントラックを調整して、ゲノムブラウザに表示グラフを追加することができます。
Comparative GenomicsEdit
UCSC ゲノムブラウザーでは、ユーザーはさまざまな種類の保存データを表示することができます。 ユーザーは、霊長類、脊椎動物、哺乳類などの異なるトラックから選択し、検索した遺伝子配列が他の種の間でどのように保存されているかを見ることができます。 また、比較アラインメントにより、種間の進化的関係をグラフィカルに表示します。 これにより、種のグループ間で保存されている領域を視覚化し、未知のDNA領域の機能的要素を予測することができる研究者にとっても、種の進化の最も説得力のある論拠の1つを説明するツールとして教室でも使用することができる便利なツールです。 ヒトのアセンブリに関する 44 方向の比較トラックでは、進化の時間を遡るほど配列の相同性は失われますが、ゲノムの機能的に重要な領域 (例えば、エクソンや制御要素、一般的にはイントロンではない) は、進化の時間をはるかに遡って保存されていることが明確に示されています。
Variation dataEdit
多くの種類のバリエーション データも表示されます。 例えば、NCBI の dbSNP データベースの各リリースの内容全体が、ヒト、マウス、その他のゲノムにマッピングされています。 これには1000ゲノムプロジェクトの成果も含まれており、dbSNPでリリースされるとすぐに表示されます。
RepeatsEdit
ゲノムブラウザのリピートトラックでは、複雑性の低い繰り返しを持つDNA領域を視覚的に見ることができます。 配列内の繰り返しを視覚化できることで、ゲノム ブラウザでの検索クエリに関する推論を素早く行うことができます。 研究者は、指定した検索に大量の繰り返し配列が含まれていることを一目で確認し、それに応じて検索やトラックの表示を調整することができる可能性があります。