推奨ブラウザ: Firefox 63.0以降、Google Chrome 70.0以降。android版ブラウザでは一部表示に問題が出る可能性があります。

KEGGエンリッチメント解析

遺伝子リストの性格を概観する

logo

ある特定の条件下で(たとえば、ガンの患者においてのみ)顕著に発現している遺伝子が幾つか見つかったとします。

こうした遺伝子がどのようなことに関連しているのか? 当該の遺伝子リストの中にどのようなタイプの遺伝子が多く含まれているのか? これらを調べ、遺伝子リストの性格を概観することは、発ガンのメカニズムを解明したり治療法を見出したりするための重要な参考となることでしょう。

遺伝子アノテーションとパスウェイ情報を利用したエンリッチメント解析は、このような目的に有効です。

KEGGエンリッチメント解析の背景

KEGGとは

KEGGは、「ゲノムや分子レベルの情報から細胞、個体、エコシステムといった生命システムの機能や有用性を理解するためのリソース(公式サイトからの引用)」として作られました。

KEGGからは様々な種類のデータベースが公開されていますが、ここではKEGG PATHWAYから提供されている情報を利用させていただきます。

解析手法・お渡しできるデータ

弊社では、統計処理用言語Rとエンリッチメント解析用パッケージGOstatsを組み合わせ、Ensemble Gene IDとKEGG pathway IDを紐づけしたアノテーションデータを用いてエンリッチメント解析を実行する環境を整えております。

現時点ではヒト・マウスに対応しています。これ以外の生物種についても承れますが、納品までに相当のお時間を戴く場合や、限定的な解析しか出来ない可能性があります。詳しくはご相談ください。

お客様から頂いた遺伝子リスト(任意の方法で得られたEnsembl Gene IDのリスト。発現変動解析のご依頼を頂いた場合はその結果をそのまま利用できます)をもとに解析し、結果は2種類のファイルの形でお渡しできます。

結果をどうみるのか

遺伝子リストとの関連性が認められた代謝経路ごとに結果をまとめたテキストファイルと画像ファイルが生成されます。

これらのファイルをセットにしてご提供します。

pathview画像

ページ冒頭に示した図は、ひとつの代謝経路とそれに関連する遺伝子・タンパク質の関係性を示したものです。 本ページではマウスの遺伝子解析の例を示しています。ページ冒頭に掲出した図をダウンロードするとファイル名がmmu05220で始まっていることがわかりますが、これは生物名(mmu = Mus musculus)とマップ番号に対応しています。まずはこのpathview画像から見ていきましょう。

四角がオルソログ、丸が関連分子(酵素タンパク質など)、線が反応の方向を示しています。

緑から赤に色がつけられている四角は、解析に供した遺伝子の中でこの代謝経路との関連性が示唆されているものに対応しています。また、それぞれの箱の塗り色は、それぞれの遺伝子の発現の増加/現象を示すlog2-foldchange値を反映しています。

結果はPNGファイルまたはSVG形式の画像としてみることが出来ます。PNG形式が「ラスタデータ」なのに対し、SVG形式は「ベクトルデータ」です。PNG形式は非常に多くの環境に対応していて簡単に閲覧したり他の文書に貼り付けたり出来ます。一方SVGデータは最近のパワーポイントで読み込むことができ、しかも図形単位で先の太さや色を変更したり出来ます。結果をスライドに張り込んで思うがままに美しく仕上げたい場合は、SVGファイルを活用してください。なお、代謝マップに有意に関連付けられている遺伝子が1個以下の場合、SVGデータは生成されません。

kegg map example

代謝マップ

KEGGの公式サイトから取得できる画像で、代謝経路ごとにどのような物質が作られていくのか、そこに関与するタンパク質にどのようなものがあるか、あるいはそれぞれの化学反応が細胞内のどこで起こっているかなどの概略を知ることが出来ます。前述のpathview画像と見比べることによって、着目している遺伝子リストについての理解が深まります。