京都大学大学院薬学研究科ゲノム創薬 京都大学21世紀COEプログラム「ゲノム科学の知的情報基盤・研究拠点形成」事業担当者
リンク サイトマップ お問合せ
研究室紹介 研究内容
研究内容
研究業績
講義・セミナー
募集案内
サブメニュー
バイオインフォマティクス
バイオインフォマティクス(bioinformatics)とは生物学(biology)で集められたデータを情報科学(information)を利用し新しい知識を発見する学問である。

歴史的に見ると、1960年代にタンパク質の配列がデータベース化され、また1980年代にDNAの配列がデータベース化された。そして、これらのデータベースは、今なおデータを蓄積し続けている。また、配列解析の手法は1970年代から研究されている。 この中で現在広く用いられるようになった手法としては、配列同士のアライメント、複数の配列のマルチプルアライメント、系統樹推定、配列のデータベース検索、ゲノム配列からの遺伝子領域予測、RNAの二次構造予測、タンパク質の二次構造および三次構造予測、機能ドメイン予測等がある。 これらの手法の確立はバイオインフォマティクスの大きな成果と言える。 このようにバイオインフォマティクスは実験によって得られるデータ、データベース技術、および解析技術により成り立っている。

今、手元に1つの遺伝子の配列があるとする。データベースおよび、解析ツールがなければ、配列情報のみから得られる知識はほとんどないだろう。つまり、実験を行わなくては何も知識は得られない。 しかし、データベースおよび、解析ツールが与えられたとしよう。 この配列が既知の配列かどうかは、データベース検索によって分かる。 既知であれば、その遺伝子の機能がある程度調べられている可能性がある。 また、似ている配列を取り出して、マルチプルアライメントを行い系統樹推定を行えば、どのようなファミリーに属する遺伝子か推定することが出来る。 タンパク質の立体構造と機能との間には相関があるので、二次構造、三次構造予測で遺伝子の機能を推定することも出来るし、配列の特定の領域が持つ機能についてはドメイン予測で調べることが出来る。このような解析は、多くの配列情報、配列に付随する生物学的情報、配列情報と生物学的情報から抽出した知識をデータベースに格納し、それらの情報を様々な角度から検索が出来るようにすることで初めて実現出来る。 このように、バイオインフォマティクスを用いることで新たな知見が得られるが、その知見は生物学へ再びフィードバックされ、次の実験計画の指針となる。 同時に、生物学的な問題を情報科学でどのように解決できるか?という問題提起を情報科学に投げかけている。 問題はアルゴリズムにより解決される場合もあるし、より大きな計算資源のあるコンピュータが開発されることで解決される場合もあるが、いずれにせよ互いに影響を及ぼしあっている。

現在、ヒトゲノムプロジェクトの完了に象徴されるようにゲノム全体の情報が入手出来るようにより、ゲノム配列に関しては必要最小限の情報は集まっている。また、cDNAプロジェクトの成果などにより、ゲノム上には約2万ほどの遺伝子がマップされている。これらのデータをバイオインフォマティクスを用いて解析し、さらに実験を行うことにより、これらの遺伝子の機能解析が進められている。 また、多様な生物学的なデータをどの様にコンピュータ上に蓄積していくかという問題も大きな問題の1つである。 テクノロジーの進歩に伴い、今日では様々な生物情報を得ることが出来るようになったが、配列は生物情報の一部にすぎず、それ以外に、タンパク質立体構造データ、パスウェイデータ、遺伝子発現データ、遺伝子相互作用データ、オントロジーデータ、などが実験等により得られるデータからデータベース化されて公開されている。

今後は様々なデータベースを活用し、生物学情報を解析するようなバイオインフォマティクスの手法がより詳細な生物のメカニズムの解明に貢献していき、生物学と共に発展していくと考えられる。
バイオインフォマティクスとゲノム創薬
ゲノム創薬科学においては、いかに効率的に、創薬標的遺伝子を絞り込むかが重要である。 大量のゲノム情報を素早く解析する必要があり、優れたアルゴリズムや多くのコンピュータ資源が必要である。 今日の創薬プロセスを成立させるにはバイオインフォマティクスの進歩なくしては考えられない。 ゲノム情報は素早くアクセス出来る必要があり、このためにはデータベース技術が鍵を握っている。 また、情報をいかに処理し、創薬に結びつく遺伝子を探し出せるかは、アルゴリズムに係っている。

我々の研究室で用いているマイクロアレイやGeneChipは細胞内で発現しているmRNAを網羅的に測定でき、様々な状況での細胞の遺伝子発現データを得ることができる。 例えば、病態遺伝子発現データを元に疾患のメカニズムを解明し、創薬標的遺伝子を特定することができる。 しかし、遺伝子発現データは様々な遺伝子ネットワークにより調整された結果であり、疾患の直接的な原因遺伝子よりも遙かに多くの遺伝子が発現変動しているため、多くの場合、単純に発現データを眺めて検討するだけでは結論にたどり着くのは困難である。 このデータから、疾患に関与するネットワークの上流に位置する遺伝子を見つけ出して来るには、統計解析を用いる方法が考えられてきたが、今後は、発現データのみで解析を行うのではなく、多くのデータベース上の知識と遺伝子発現を有機的に結びつけた解析を行う必要がある。

他の例としては、今までの鑑別診断が困難だった疾患に対して遺伝子発現をパターン認識を用いて鑑別判断を行うこともコストが見合えば可能になりつつあり、バイオインフォマティクスによるテーラーメイド医療への1つの可能性として注目されている。 同様に遺伝子発現パターン認識を用いると、薬物の毒性をある程度評価出来ることも知られている。 評価方法は次のように行われる。まず、副作用のある薬物を投与した際の発現パターンおよび、副作用のない薬物の場合の発現パターンをあらかじめ用意しておき、それらをコンピュータに学習させる。 次に、毒性が未知の薬物を投与し発現パターンを測定する。得られたパターンがどちらのパターンと類似しているかを調べることで、毒性を評価できる。

(KEGGより)
 
現在はマイクロアレイやGeneChipによる遺伝子発現データが利用されているが、今後はそれに加えてタンパク質チップによる遺伝子発現データが利用されるようになることや、遺伝子間相互作用データベースの充実などにより、遺伝子発現データと細胞シミュレーションモデルを統合した解析などが行われるようになると思われる。
Copyright© KYOTO UNIVERSITY All Rights Reserved.