KEGG icon KEGG   KEGG2   PATHWAY   BRITE   MEDICUS   transparent  
   ヘルプ
» English

KEGG の概要

1. ゲノムから生命システムへ

KEGG はゲノムや分子レベルの情報から細胞、個体、エコシステムといった生命システムの機能や有用性を理解するためのリソースです。生命システムのコンピュータ表現として、遺伝子やタンパク質(ゲノム情報)と化合物など(ケミカル情報)の分子部品の情報を、分子間の相互作用・反応・関係ネットワーク(システム情報)の知識で統合した生命システム情報統合データベースです。

KEGG overview

KEGG は 1995年より金久ラボラトリーズで開発されており、今ではゲノムと高次生命システムをつなぐ知識のレファレンスとして、とくにシークエンシングやその他のハイスループット実験技術がもたらす大量データの統合処理・解釈に広く利用されています。

2. KEGG データベース

KEGG は以下の 16のデータベースから構成される統合データベースです。これらはシステム情報、ゲノム情報、ケミカル情報に大別され、さらに各ウェブページでは 5つのカラーコードで区別されています。

カテゴリ データベース 内容 カラー
システム情報 KEGG PATHWAY KEGG パスウェイマップ kegg3
KEGG BRITE BRITE 機能階層
KEGG MODULE 機能単位 KEGG モジュール
KEGG DISEASE ヒト疾患 (日本語) kegg5
KEGG DRUG 医薬品 (日本語)
KEGG ENVIRON 生薬・天然物など
ゲノム情報 KEGG ORTHOLOGY オーソログ (KO) グループ kegg4
KEGG GENOME 全ゲノム配列既知の KEGG 生物種 kegg1
KEGG GENES 各生物種の遺伝子カタログ
KEGG SSDB GENES の配列類似度とベストヒット情報
ケミカル情報 KEGG COMPOUND 代謝物質など低分子化合物 kegg2
KEGG GLYCAN 糖鎖
KEGG REACTION 生体内化学反応
KEGG RPAIR 反応ペア
KEGG RCLASS 反応クラス
KEGG ENZYME 酵素

これらのデータベースには生命システムのコンピュータ表現として様々なデータオブジェクトが含まれています。各データベースのエントリは KEGG オブジェクトと呼ばれ、データベースごとに定められたプリフィックスと5桁の番号からなる KEGG オブジェクト識別子がエントリ名となっています (KEGG Objects 参照)。

リリース データベース オブジェクト識別子
1995KEGG PATHWAYmap number
KEGG GENESlocus_tag / GeneID
KEGG ENZYMEEC number
KEGG COMPOUNDC number
2000KEGG GENOMEorganism code / T number
2001KEGG REACTIONR number
2002KEGG ORTHOLOGY  K number
2003KEGG GLYCANG number
2004KEGG RPAIRRP number
2005KEGG BRITEbr number
KEGG DRUGD number
2007KEGG MODULEM number
2008KEGG DISEASEH number
2010KEGG ENVIRONE number
KEGG RCLASSRC number

3. KEGG 分子ネットワーク

KEGG で最もユニークなデータベースは高次生命システム機能に関する知識を分子間相互作用・反応・関係ネットワークとして表現したシステム情報の部分です。ここでは文献等から集約した知識を以下の表現でコンピュータ化しています。
  • パスウェイマップ - KEGG PATHWAY (Pathway maps 参照)
  • 階層リスト (オントロジー) - KEGG BRITE (Brite hierarchies)
  • メンバーシップリスト - KGG MODULE, KEGG DISEASE
これらのデータベースは高次生命システム機能解読のためのレファレンス知識ベースで、KEGG マッピングと呼ぶ手続き (KEGG mapping 参照) により、ゲノム解読やハイスループット実験データの解釈を可能にします。

このようなマッピングの概念は 1995年に KEGG プロジェクトが開始されたときに始めて導入され実用化されました。当初は EC 番号を用いてゲノムから代謝パスウェイ再構築を行っていましたが、その後代謝系以外の様々なパスウェイに対応するために、また EC 番号の不備を補うために、ortholog ID と呼ぶ識別子が導入されました。現在はこれをさらに見直し拡張した KO (KEGG Orthology) システムを用いてゲノムアノテーションと KEGG 分子ネットワークへのマッピングが行われています。

時期 識別子 知識ベース 割当単位
1995-1999 EC 番号 代謝パスウェイ ドメイン
2000-2002 Ortholog ID 代謝・制御パスウェイ ドメイン
2003- KO パスウェイおよび BRITE 機能階層 遺伝子

参考文献

  1. Kanehisa, M.; Toward pathway engineering: a new database of genetic and molecular pathways. Science & Technology Japan, No. 59, pp. 34-38 (1996). [pdf]
  2. Kanehisa, M.; A database for post-genome analysis. Trends Genet. 13, 375-376 (1997). [pubmed]
  3. Ogata, H., Goto, S., Sato, K., Fujibuchi, W., Bono, H., and Kanehisa, M.; KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res. 27, 29-34 (1999). [pubmed] [pdf]
  4. Kanehisa, M. and Goto, S.; KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res. 28, 27-30 (2000). [pubmed] [pdf]
  5. Kanehisa, M., Goto, S., Kawashima, S., and Nakaya, A.; The KEGG databases at GenomeNet. Nucleic Acids Res. 30, 42-46 (2002). [pubmed] [pdf]
  6. Kanehisa, M., Goto, S., Kawashima, S., Okuno, Y., and Hattori, M.; The KEGG resources for deciphering the genome. Nucleic Acids Res. 32, D277-D280 (2004). [pubmed] [pdf]
  7. Kanehisa, M., Goto, S., Hattori, M., Aoki-Kinoshita, K.F., Itoh, M., Kawashima, S., Katayama, T., Araki, M., and Hirakawa, M.; From genomics to chemical genomics: new developments in KEGG. Nucleic Acids Res. 34, D354-357 (2006). [pubmed] [pdf]
  8. Kanehisa, M., Araki, M., Goto, S., Hattori, M., Hirakawa, M., Itoh, M., Katayama, T., Kawashima, S., Okuda, S., Tokimatsu, T., and Yamanishi, Y.; KEGG for linking genomes to life and the environment. Nucleic Acids Res. 36, D480-D484 (2008). [pubmed] [pdf]
  9. Kanehisa, M., Goto, S., Furumichi, M., Tanabe, M., and Hirakawa, M.; KEGG for representation and analysis of molecular networks involving diseases and drugs. Nucleic Acids Res. 38, D355-D360 (2010). [pubmed] [pdf]
  10. Kanehisa, M., Goto, S., Sato, Y., Furumichi, M., and Tanabe, M.; KEGG for integration and interpretation of large-scale molecular datasets. Nucleic Acids Res. 40, D109-D114 (2012). [pubmed] [pdf]

Last updated: October 1, 2012
Copyright 1995-2012 Kanehisa Laboratories