transparent KEGG   KEGG2   PATHWAY   BRITE   MEDICUS   DBGET  

GenomeNet [ English | Japanese ]
Search for

line
ゲノムネット
 ゲノムネットとは
 お知らせ
 謝辞
統合データベース
 統合DBの概要
 DBGETの概要
 リリース情報
医薬品データベース
KEGG
varDB
研究支援データベース
計算ツール
 その他のツール
FTP
フィードバック

DBGET の概要

1. 分子生物学データのウェブ

DBGET システムはゲノムネットのバックボーンとなる検索システムです。そこではデータベースはエントリーという単位の集合として取り扱われます。既存の分子生物学関連データベースのほとんどは、このような単純な見方で(すなわち、フラットファイルとして)眺めることができます。各エントリーにはエントリー名(またはアクセッション番号)というデータベース内でユニークな名前がつけられていますので、
データベース名:エントリー名
の組を与えると、世界中に存在する数多くのデータベースを統合的に参照することができるわけです。また、KEGG にある生物種ごとの遺伝子やタンパク質は
生物種名:遺伝子名
により、やはり DBGET で統合的に検索することができます。

分子生物学の分野では異なるデータベースに関連するデータがあれば、それにリンクを付加してデータベース化が行われています。文献データと文献に報告された配列データとの関連、塩基配列とそれを翻訳したアミノ酸配列の関連などが代表例です。このリンク情報は
データベース1:エントリー1 → データベース2:エントリー2
の形で表現され、これを2項関係といいます。DBGET では LinkDB と呼ぶ2項関係だけのデータベースをもっており、2項関係を演繹して(組み合わせたり、逆向きにたどったりして)新たな2項関係を作ることにより、多くの関連データを容易に見いだせるようになっています。また、リンクはゲノムネットの外のデータベースにも多数つけられており、より専門的なデータベースで細かな情報を調べることができるようになっています。

2. データベースの分類

DBGET/LinkDB システムでは多数のデータベースを統合するために、データベース利用条件の違い(ミラリング可、キーワードインデクシング可、リンクのみ)を考慮して、各データベースを以下の5つのカテゴリーに分類しています。

カテゴリー検索コマンド備考
bgetbfindblink
1. KEGGデータベースyesyesyesゲノムネットでミラリング
2. その他のDBGETデータベースyesyesyes
3. Web上の検索可能データベースnoyesyes各サイトのサービスを利用
4. Web上のリンクのみのデータベースnonoyes
5. PubMedデータベースyesnoyes

3. KEGGデータベース (カテゴリー1)

ゲノムネットが提供するKEGGデータベースは以下の通りで、多くのものは毎日更新されています。

データベース内容備考
brite 機能階層・オントロジー KEGG BRITE
pathway パスウェイマップ KEGG PATHWAY
module KEGG モジュール
disease 病気 KEGG DISEASE (日本語)
drug 医薬品 KEGG DRUG (日本語)
dgroup 医薬品グループ
environ 生薬・天然物、環境物質、ほか KEGG ENVIRON (日本語)
orthology オーソログ (KO) グループ KEGG ORTHOLOGY
genome KEGG生物種 KEGG GENOME
mgenome メタゲノム
genes 高精度ゲノム中の遺伝子カタログ KEGG GENES
mgenes メタゲノム中の遺伝子カタログ
compound 化合物 KEGG COMPOUND
glycan 糖鎖 KEGG GLYCAN
reaction 化学反応 KEGG REACTION
rclass 反応クラス
enzyme 酵素分類
expression マイクロアレイ遺伝子発現プロフィール 著者による登録

4. その他のDBGETデータベース (カテゴリー2)

ゲノムネットがミラリングしているデータベースは以下の通りです。

データベース内容元サイト
refseq refnuc 核酸塩基配列 NCBI
refpep タンパク質アミノ酸配列
uniprot swissprot ExPASy / EBI
trembl
egenes ESTコンティグとしての遺伝子カタログ Kyoto
egenes ESTコンティグデータセット
pdb タンパク質立体構造 RCSB
pdbstr PDBアミノ酸配列 京都大学
epd 真核生物プロモーター ISREC
motifdic prosite タンパク質配列モチーフ ExPASy
pfam Sanger
ncbi-cdd NCBI
pmd 変異タンパク質 国立遺伝学研究所
aaindex アミノ酸指標 京都大学
carbbank 糖鎖構造 (更新なし) 帝京大学/ジョージア大学
prosdoc PROSITE文献 ExPASy

5. Web上の検索可能データベース (カテゴリー3)

ゲノムネットでキーワード検索のみできるデータベースは以下の通りです。

データベース内容元サイト
insdc genbank 核酸塩基配列 NCBI
ddbj 国立遺伝学研究所
embl EBI
ncbi-gene Entrez 遺伝子データベース NCBI
unigene UniGene 遺伝子データベース NCBI
ensembl 真核ゲノムアノテーション Ensembl
hgnc ヒト遺伝子名 HGNC
hmdb ヒトメタボローム HMDB
go 遺伝子オントロジー GO
brc-dna ヒト完全長cDNAクローン 理研BRC
interpro タンパク質ファミリー・ドメイン EBI
omim 遺伝病 NCBI
pubchem PubChem 化合物データベース NCBI
chebi ChEBI 化合物データベース EBI
pdb-ccd PDB リガンド辞書 PDB
lipidmaps 脂質代謝 LIPIDMAPS
lipidbank 脂質 LipidBank
knapsack 植物二次代謝産物 KNApSAcK
3dmet 天然化合物の立体構造 3DMET
drugbank 医薬品とターゲット DrugBank
ligandbox 医薬品の立体構造 LigandBox
sider 医薬品の副作用 SIDER

参考文献

  1. Kanehisa, M.; Linking databases and organisms: GenomeNet resources in Japan. Trends Biochem Sci. 22, 442-444 (1997). [pubmed]
  2. Fujibuchi, W., Goto, S., Migimatsu, H., Uchiyama, I., Ogiwara, A., Akiyama, Y., and Kanehisa, M.; DBGET/LinkDB: an integrated database retrieval system. Pacific Symp. Biocomputing 1998, 683-694 (1997). [pubmed] [pdf]

    (DBGETのルーツは1980年代にGenBankのために開発されたIDEASシステムです)
  3. Kanehisa, M., Klein, P., Greif, P., and DeLisi, C.; Computer analysis and structure prediction of nucleic acids and proteins. Nucleic Acids Res. 12, 417-428 (1984). [pubmed] [pdf]
  4. Kanehisa, M.I.; Los Alamos sequence analysis package for nucleic acids and proteins. Nucleic Acids Res. 10, 183-196 (1982). [pubmed] [pdf]

Last updated: December 11, 2014
line
京都大学化学研究所バイオインフォマティクスセンター