ヘルプ
» English
KEGG icon

KEGG の概要

1. ゲノムから生命システムへ

KEGG はゲノムや分子レベルの情報から細胞、個体、生物界といった生命システムがもつ高次の機能や有用性を理解するためのリソースです。生命システムのコンピュータモデルとして、遺伝子やタンパク質(ゲノム情報)と化合物など(ケミカル情報)の分子部品の情報を、分子間の配線図である相互作用・反応ネットワーク(システム情報)で統合した形で表現されています。さらに疾患・医薬品情報(ヘルス情報)もゆらいだ分子ネットワークとして統合されています。
KEGG model
KEGG 開発の基本概念と背景については金久ラボラトリーズのウェブサイトをご覧ください。KEGG はゲノムと高次生命システムをつなぐ知識のレファレンスであり、とくに KEGGマッピングの手法でシークエンシングやその他のハイスループット実験技術がもたらす大量データを統合処理・解釈することに広く利用されています。

2. KEGG データベース

KEGG モデルは以下の 16のデータベースを統合したリソースとして実装されています。これらはシステム情報、ゲノム情報、ケミカル情報、ヘルス情報に大別され、さらに各ウェブページでは 5つのカラーコードで区別されています。

カテゴリ データベース 内容 カラー
システム情報 KEGG PATHWAY KEGG パスウェイマップ kegg3
KEGG BRITE BRITE 機能階層・テーブル
KEGG MODULE KEGG モジュールと反応モジュール
ゲノム情報 KEGG ORTHOLOGY (KO) 機能オーソログ kegg4
KEGG GENES 遺伝子・タンパク質 kegg1
KEGG GENOME 全ゲノム配列既知の KEGG 生物種
ケミカル情報 KEGG COMPOUND 代謝物その他の化学物質 kegg2
KEGG GLYCAN 糖鎖
KEGG REACTION
KEGG RCLASS
生体内化学反応
反応クラス
KEGG ENZYME 酵素
ヘルス情報 KEGG NETWORK 疾患関連のネットワーク要素 kegg5
KEGG VARIANT ヒト遺伝子バリアント
KEGG DISEASE ヒト疾患 (日本語)
KEGG DRUG
KEGG DGROUP
医薬品 (日本語)
医薬品グループ (日本語)
ケミカル情報カテゴリの総称は KEGG LIGAND
ヘルス情報カテゴリと医薬品添付文書の統合リソースは KEGG MEDICUS (日本語)

これらのデータベースには生命システムのコンピュータ表現として様々なデータオブジェクトが含まれています。各データベースのエントリは KEGG オブジェクトと呼ばれ、データベースごとに定められたプリフィックスと5桁の数字からなる KEGG オブジェクト識別子がエントリ名となっています (KEGG Objects 参照)。

リリース データベース オブジェクト識別子 注記
1995KEGG PATHWAYmap number
KEGG GENESlocus_tag / GeneID
KEGG ENZYMEEC number
KEGG COMPOUNDC number
1998KEGG REACTIONR number
2000KEGG GENOMEorganism code / T number
2002KEGG ORTHOLOGY  K numberOrtholog IDs in 2000
2003KEGG GLYCANG number
2004KEGG RPAIRRP numberDiscontinued in 2016
2005KEGG BRITEbr number
KEGG DRUGD number
2006KEGG MODULEM number
2008KEGG DISEASEH number
2010KEGG RCLASSRC number
KEGG EDRUGE numberRenamed to ENVIRON
2011KEGG ENVIRONE numberDiscontinued in 2021
2014KEGG DGROUPDG number
2017KEGG NETWORKN number / nt number
KEGG VARIANTGeneID+variant number

3. KEGG 分子ネットワーク

KEGG で最もユニークなデータベースは高次生命システム機能に関する知識を分子間相互作用・反応・関係ネットワークとして表現したシステム情報の部分です。ここでは文献等から集約した知識を以下の表現でコンピュータ化しています。 これらのデータベースは高次生命システム機能解読のためのレファレンス知識ベースで、KEGG マッピングと呼ぶ手続き (KEGG mapping 参照) により、ゲノム解読やハイスループット実験データの解釈を可能にします。

このようなマッピングの概念は 1995年に KEGG プロジェクトが開始されたときに初めて導入され実用化されました。当初は EC 番号を用いてゲノムから代謝パスウェイ再構築を行っていましたが、その後代謝系以外の様々なパスウェイに対応するために、また EC 番号の不備を補うために、ortholog ID と呼ぶ識別子が導入されました。現在はこれをさらに見直し拡張した KO (KEGG Orthology) システムを用いてゲノムアノテーションと KEGG 分子ネットワークへのマッピングが行われています。

時期 識別子 知識ベース 割当単位
1995-1999 EC 番号 代謝パスウェイ ドメイン
2000-2002 Ortholog ID 代謝・制御パスウェイ ドメイン
2003- KO パスウェイおよび BRITE 機能階層 遺伝子

別の見方をすると、KO は分子ネットワーク上でのオーソログとして定義され、個々の遺伝子情報を一般化したものです。KEGG にはこれ以外にも同様の一般化が、特殊な分子ネットワークについて行われています。

ネットワークタイプ クラス インスタンス
すべてのタイプ KO (遺伝子オーソログ) 遺伝子 in KEGG GENES
生体内化学反応 RC (反応クラス) 反応 in KEGG REACTION
医薬品相互作用 DG (医薬品グループ) 医薬品 in KEGG DRUG

4. ネットワークバリアント

これまで KEGG データベースでは、遺伝子やゲノムについて生物種間での保存性と多様性に着目した開発を行ってきました。とくに KEGG パスウェイマップ、BRITE 機能階層、KEGG モジュールを、機能オーソログ (KO) をノードとしたネットワークとして開発することにより、KEGG パスウェイマッピングその他の手続きがどんな生物種にも適用できるようにしました。

KEGG variation

しかしながらこのような一般的なアプローチでは、より詳細な生物種内の多様性、とくに疾患に関連したヒトゲノムと遺伝子の多様性を適切に表現することができません。そこで新たに開発を始めたのが KEGG NETWORK データベースです。疾患や医薬品に関する知識を、遺伝子バリアントだけでなくウイルスその他の要素も含めたネットワークバリアントとして蓄積しています。

参考文献

  1. Kanehisa, M.; Toward pathway engineering: a new database of genetic and molecular pathways. Science & Technology Japan, No. 59, pp. 34-38 (1996). [pdf]
  2. Kanehisa, M.; A database for post-genome analysis. Trends Genet. 13, 375-376 (1997). [pubmed] [doi]
  3. Ogata, H., Goto, S., Sato, K., Fujibuchi, W., Bono, H., and Kanehisa, M.; KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res. 27, 29-34 (1999). [pubmed] [doi]
  4. Kanehisa, M. and Goto, S.; KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res. 28, 27-30 (2000). [pubmed] [doi]
  5. Kanehisa, M., Goto, S., Kawashima, S., and Nakaya, A.; The KEGG databases at GenomeNet. Nucleic Acids Res. 30, 42-46 (2002). [pubmed] [doi]
  6. Kanehisa, M., Goto, S., Kawashima, S., Okuno, Y., and Hattori, M.; The KEGG resources for deciphering the genome. Nucleic Acids Res. 32, D277-D280 (2004). [pubmed] [doi]
  7. Kanehisa, M., Goto, S., Hattori, M., Aoki-Kinoshita, K.F., Itoh, M., Kawashima, S., Katayama, T., Araki, M., and Hirakawa, M.; From genomics to chemical genomics: new developments in KEGG. Nucleic Acids Res. 34, D354-357 (2006). [pubmed] [doi]
  8. Kanehisa, M., Araki, M., Goto, S., Hattori, M., Hirakawa, M., Itoh, M., Katayama, T., Kawashima, S., Okuda, S., Tokimatsu, T., and Yamanishi, Y.; KEGG for linking genomes to life and the environment. Nucleic Acids Res. 36, D480-D484 (2008). [pubmed] [doi]
  9. Kanehisa, M., Goto, S., Furumichi, M., Tanabe, M., and Hirakawa, M.; KEGG for representation and analysis of molecular networks involving diseases and drugs. Nucleic Acids Res. 38, D355-D360 (2010). [pubmed] [doi]
  10. Kanehisa, M., Goto, S., Sato, Y., Furumichi, M., and Tanabe, M.; KEGG for integration and interpretation of large-scale molecular datasets. Nucleic Acids Res. 40, D109-D114 (2012). [pubmed] [doi]
  11. Kanehisa, M., Goto, S., Sato, Y., Kawashima, M., Furumichi, M., and Tanabe, M.; Data, information, knowledge and principle: back to metabolism in KEGG. Nucleic Acids Res. 42, D199–D205 (2014). [pubmed] [doi]
  12. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., and Tanabe, M.; KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44, D457-D462 (2016). [pubmed] [doi]
  13. Kanehisa, Furumichi, M., Tanabe, M., Sato, Y., and Morishima, K.; KEGG: new perspectives on genomes, pathways, diseases and drugs. Nucleic Acids Res. 45, D353-D361 (2017). [pubmed] [doi]
  14. Kanehisa, M., Sato, Y., Furumichi, M., Morishima, K., and Tanabe, M.; New approach for understanding genome variations in KEGG. Nucleic Acids Res. 47, D590-D595 (2019). [pubmed] [doi]
  15. Kanehisa, M; Toward understanding the origin and evolution of cellular organisms. Protein Sci. 28, 1947-1951 (2019). [pubmed] [doi]
  16. Kanehisa, M., Furumichi, M., Sato, Y., Ishiguro-Watanabe, M., and Tanabe, M.; KEGG: integrating viruses and cellular organisms. Nucleic Acids Res. 49, D545-D551 (2021). [pubmed] [doi]
  17. Kanehisa, M., Furumichi, M., Sato, Y., Kawashima, M. and Ishiguro-Watanabe, M.; KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51, D587-D592 (2023). [pubmed] [doi]

Last updated: September 1, 2023

Copyright 1995-2024 Kanehisa Laboratories