blog

【2022年最新版】話題のバイオインフォマティクスについて分かりやすく紹介!

バイオインフォマティクス

バイオインフォマティクスとは?

皆さんは『バイオインフォマティクス』という言葉を聞いたことがありますか?
バイオインフォマティクスとは日本語で『生命情報科学』や『生物情報学』、『情報生命科学』などと表記されることもある学問分野です。
生命科学と情報科学・統計学などの融合分野の1つであり、比較的新しく1990年代ごろから発展してきました。
「生命科学」は学校でも生物学などを習うのでイメージしやすいでしょうか?
「情報科学」はコンピュータを用いて行うプログラミングや統計といった情報処理のことです。
これらの2分野はもともと独自に発展してきた分野ですが、ゲノム解析などが盛んに行われるようになり、生物学で扱うデータが大幅に増えてくると、情報処理分野との連携が必要と見なされてきました。

ところで皆さんDNAが何なのか、何となく理解ができると思います。
遺伝情報が含まれている細胞のことですが、現代ではゲノム解析といった技術の進歩によって、そのDNAから膨大なデータを抽出することが出来るようになりました。
しかし、人間の手だけでは解析できる情報量に限りがあります。
そこでプログラミングや統計といった情報処理技術を用いて、より効率的に、かつ膨大なデータを扱う技術が発達してきたのです。

簡単にまとめると、生命を調査、研究する際に、その実験結果やデータを扱い処理する方法として情報科学技術を利用し、その生命現象を解き明かしていく、それがバイオインフォマティクスなのです。

現在ではバイオインフォマティクスはあらゆる分野で活用されており、その調査・研究対象からデータの処理方法まで多様化しているため、具体的にはこれ!と断言できるようなものではありません。
ただし、どういったジャンルの研究をしているにしてもバイオインフォマティクスに関わる人材は『生命科学』と『情報科学』両方の知識や技術を身に着けている必要があります。

バイオインフォマティクスが発展してきた理由

バイオインフォマティクスは比較的新しい分野であるといいましたが、1990年代ごろから今日まで飛躍的に発展してきた歴史があります。
今や生命科学の分野において欠かせないバイオインフォマティクスがいかに発展してきたか、その経緯について見ていきましょう。

バイオインフォマティクスが急速に発展してきたきっかけには1980年代ごろから1990年代ごろにかけて世界中で行われていた『ゲノム解析』が大きな要因としてあります。
ゲノム解析はDNAに含まれる遺伝子情報を解読するというものでしたが、遺伝子情報は塩基配列といった極めて莫大でかつ量的なデータを解析する必要がありました。塩基配列はA、T、C、Gといった記号であらわされ、これらの膨大なデータをコンピュータなどのツールや情報処理技術を使わずに分析することはきわめて困難です。
そこで世界的に情報処理の分野と生命科学の分野が協力し、これらの研究を進めてきたという経緯があります。
ゲノム解析が大部分終わった後も、生命科学の実験やデータ分析に情報処理の技術を用いる有用性は明らかであり、その後も生命科学のあらゆる分野においてこういった手法が使われるようになりました。

こういった歴史から、バイオインフォマティクスは今日まで生命科学の最前線で注目される学問分野にまで発展したのです。

バイオインフォマティクスの具体例

試験管と青い水

バイオインフォマティクスのイメージをすることはできたと思いますが、具体的にはどういった実験やデータ処理をするのでしょうか?
多様化しているバイオインフォマティクスですが、その主要な取り組みや特に効果が認められている実験方法について紹介していきたいと思います。

ゲノム解析

ゲノム解析はバイオインフォマティクスにとって欠かせない要素です。
ゲノム解析とは多くの生物の遺伝情報を解明するための実験・技術であり、それらはDNAに含まれる遺伝情報すなわち塩基配列を明らかにすることによって解読されます。
塩基配列とはA、T、C、Gといった記号であらわされ、それら単体では単なる記号のデータにしかなりません。しかしこれらの膨大な塩基は複数個でゲノムすなわち遺伝子や染色体の情報を構築しており、ゲノム解析はこれらすべての塩基配列を明らかにして、どの塩基配列がなんの遺伝情報をつかさどっているのか解読していく必要があります。
そのため基本となる塩基のデータは全てA、T、C、Gといったシンプルなデータであらわされるのですが、その量は何十億にもぼるためコンピュータなどのツールと非常に相性が良いのです。
現在ではゲノム解析は自動的にコンピュータで解析できるまでになっています。
しかし長年にわたる解析の結果、ヒトゲノム(人間のDNA情報)はほぼすべてが完全に解析されており、今では解析された遺伝子の相互作用や病気との因果関係などを明らかにする方向へシフトしています。

生体内におけるネットワーク解析

人間の生命現象は生体内&生体外の様々な分子の相互作用によって成り立っています。
上記で説明したゲノム解析などの成果によって、生命科学の分野では個別の遺伝子やタンパク質の情報については研究が進んできました。
しかし、実際の生命現象はこれら個別の遺伝子が相互に作用しあってより複雑な現象を起こしているので、現在ではそれらの相互作用がどうなっているのか解明するための研究が盛んに行われています。
ゲノム解析などと同様に、ゲノム情報や塩基配列のデータは非常に膨大になるため、大量のデータを処理&分析するのに長けたバイオインフォマティクスの技術は非常に重要とされています。
具体的には遺伝子同士の相互作用のことを『パスウェイ』といい、これらの構造をグラフ化したりデータベースに登録することで、様々な研究チームや世界中の研究者が協力してタンパク質生成や代謝といった生物の基本的な機能の仕組みを分析しています。

タンパク質の構造解析

お肉

タンパク質は人間の体の約15~20%を構成する非常に重要な要素です。
これらのたんぱく質は約20種類のアミノ酸が結合して出来ており、構成するアミノ酸の配列によって機能が異なります。この構造をコンピュータによって予測することが生命科学の大きな課題とされており、2002-2006年までに行われた文部科学省の『タンパク3000プロジェクト』の結果が現在までWebで公開されるなど、様々な取り組みがなされています。

タンパク質3000構造ギャラリーHPは、こちらからご覧ください。
>>タンパク質3000構造ギャラリー

これらの研究において、情報技術の発展に従いタンパク質の構造をモデリングし分析することが可能となってきました。ゲノム解析がほぼ完了した現在、人間に限らず生物は想像以上の新規タンパク質を有していること分かっています。
これらのタンパク質がそれぞれどんな機能を持っているか知るための手段として、立体構造決定する方法通称『構造ゲノミクス』が話題となっているのです。
この分野はバイオインフォマティクスの中でも構造バイオインフォマティクスといわれ、これまでにないタンパク質の機能解明のアプローチとして現在も多くの研究がなされています。

次世代シーケンシング

男性とペトリ皿

次世代シーケンシングとは通称NGS(Next Generation Sequencer)と呼ばれ、数千から数百万ものDNA分子を同時に配列決定することが可能な画期的な基盤技術のことを指します。
変異の探索や病気の原因遺伝子の特定などをするうえで、効率的にDNAの配列を決定できるこの技術はゲノムサイエンスに革命をもたらしたとされています。

その高速性や扱えるデータ量がどのくらいかというと、従来の方法でDNAの塩基配列を決定する場合は1~96のDNAを同時に処理するのが限界だったのに対し、次世代シーケンシングでは1回で数千億もの塩基情報を得られるため、扱えるデータ量が格段に増えたことが分かります。
この技術は生命科学において非常に強力な方法です。もはや次世代シーケンシングとバイオインフォマティクスは切っても切り離せない関係にあり、次世代シーケンシングを用いて研究する研究者は、広い意味で全員がバイオインフォマティクスを行っているともいえます。
次世代シーケンシングはコンピュータの処理なくしては成り立ちません。しかし、多くのデータからより効率的に分析を行うためにバイオインフォマティクスも日々発展しており、現在ではバイオインフォマティクス専用のツールを使えば、これらのデータを遺伝子の機能や構造別にファイル形式で出力できるようにまでなっています。

こういったツールの開発も相まって、敷居の高かったバイオインフォマティクスに数多くの研究者が参加出来るようになりました。

集団遺伝学

集団遺伝学は個体群や生物群集の遺伝子プールといったあるカテゴリーに属する遺伝情報のまとまりを対象に、進化と遺伝について確率論や統計学といった数学的手法を用いて研究する方法のことを指します。
突然変異や遺伝的組み換えといった事柄を研究する際には非常に有効な手段であり、確率論や統計学を主に用いることからバイオインフォマティクスとして発展してきました。
もともとは進化論でおなじみのチャールズ・ダーウィンの自然選択説と、グレゴール・ヨハン・メンデルの遺伝法則の分野が融合して出来た分野であるため、歴史は長いですが、近年の情報処理技術の発展にともない更なる発展が期待されています。

さてここまで読んで、どうでしたか?
バイオインフォマティクスの具体例としていくつか挙げてきましたが、これらすべてに共通することは『膨大なデータを扱う必要がある』ということです。
生物科学はもともと生物という難解で複雑なものを対象に研究しているため、各研究分野が狭く深くという状態であり、分野を横断するような研究やデータの分析が進んでいなかったという歴史があります。
しかし、実験方法の発展により扱うデータ量が飛躍的に増え、その対象も限定的なものではなくなってきたため、新しい手法の確立が必要となりました。そこでバイオインフォマティクスが生まれ、現在に至るまで発展してきたのです。

世界に誇れる日本の『DDBJ』とは?

バイオインフォマティクスの発展にゲノム解析が深く関わっていることは説明しましたが、そこで得られたデータはどのように扱われてきたのでしょうか。

実はそれらのデータを専門的に扱うDDBJ(DNA Data Bank of Japan)と呼ばれるものがあります。
これは日本におけるDNAのデータベースであり、国際塩基配列データバンクの1つです。
国際塩基配列データバンクには他に欧州のEBIと、米国のNCBIの2つがあります。
DDBJの歴史は古く、1980年には欧州から日本へ国際協力の要請があり、1987年にはDDBJがオンラインで利用可能となりました。
これらのDDBJを含む国際塩基配列データバンクの開発により、ゲノム解析や関連分野の研究は大きな発展をとげました。

このようなシステムのすごい点は、データベースに各研究者が解析したゲノムの塩基配列をそれぞれ登録し、かつ閲覧することが出来る点です。
またデータベースの中で各研究者や研究所がデータを共有できるだけでなく、日本のDDBJ、欧州のEBI、米国のNCBがそれぞれがデータを共有しています。
またデータは全て無料で公開されていて、登録されているデータをDNA配列やアミノ酸配列の検索によって見付けることが可能なので、研究者にとっては非常に便利なシステムです。

これらのデータベースの開発とそのデータ取り扱いのルールを定めたことによって、ゲノム解析を含む生命科学の研究は飛躍的に発展しました。
このシステムの開発と維持には、多くの研究者やシステム開発やデータベース構築を担当するエンジニアの協力があり、まさにバイオインフォマティクス発展の一歩だったといえます。

DDBJ-国立遺伝学研究所HPは、こちらからご覧ください。
>>DDBJ-国立遺伝学研究所HP

バイオインフォマティシャン

女性と顕微鏡

これまでの説明でバイオインフォマティクスが生命科学の分野において非常に重要なものであることが分かったと思います。

しかし、バイオインフォマティクスに携わる人材である『バイオインフォマティシャン』は常に人材不足の状況であるそうです。それもそのはず、バイオインフォマティクスを研究のレベルまで使いこなせる人材は生命科学と情報科学どちらにも精通している必要があります。
しかし、生命科学も情報科学もそれ単体で修めることですら非常に難しい分野です。バイオインフォマティシャンはどちらの分野においてもエキスパートである必要があるため、人材が育たないのはある意味仕方のないことです。

これらの問題点については、バイオインフォマティクスが盛んになってきた1990年代から指摘され続けており、分野横断的な人材の育成や今後の需要拡大にむけた取り組みが行われてきました。
東京大学では2003年から情報生命専攻が設置するなど、積極的にバイオインフォマティシャンを育成するための取り組みがなされています。
しかし2022年現在でも深刻なバイオインフォマティシャンの不足が問題となっているので、従来の人材育成以外のアプローチが必要なのではないかとの議論もよんでいます。

例えば、バーチャルでバイオインフォマティシャンを育てる育成組織を作ることによって、新たなバイオインフォマティクスのプロを育成しつつ、従来の教育機関の研究者もバイオインフォマティシャンとして教育・育成するといったアイデアが挙げられています。
実際バイオインフォマティシャンとして活躍する可能性が高いのは、現在生命科学の分野ですでに研究機関に属している人材が、情報科学技術を身に着けた場合だとされています。
そのため若い人材をバイオインフォマティシャンとして育成することも大切ですが、現在生命科学の分野で活躍している人材をよりパワーアップさせるような仕組みが求められているのです。

バイオインフォマティクスは成長産業であり、2020年~2027年までの1年平均成長率は13.4%になるともいわれているので、今後こういった取り組みがますます盛んになっていくと予想されます。

バイオインフォマティシャンになるための試験

バイオインフォマティシャンとして活躍するには、生命科学と情報科学どちらもハイレベルに修める必要がありますが、バイオインフォマティクスに精通していることを示す認定試験が日本には存在します。
それは『バイオインフォマティクス技術者認定試験』です。
バイオインフォマティクス技術者認定試験が具体的にどのような試験なのか、その内容を見ていきましょう。

バイオインフォマティクス技術者認定試験

試験はバイオインフォマティクスに関する基礎知識から先端知識まで、幅広く熟知していることを示せるように設計されています。
そのため学生や研究者の方が、バイオインフォマティクスの入門として学習するのに適した内容だといえます。
試験のやり方は2019年まではマークシート試験で、2020年からはCBT試験に変更されました。
CBT試験とはパソコンの画面から回答していく形式の試験なので、資格試験など受けたことがある人にとってはおなじみの試験方式です。
また2019年から、バイオインフォマティクス技術者認定試験の合格者は日本バイオインフォマティクス学会の入会金および初年度年会費が無料といった嬉しい特典もついています。
バイオインフォマティクス技術者認定試験は総じて、バイオインフォマティクスに興味のある方がその知識を身に着け、スキルを証明するのに非常に取り掛かりやすい試験であるといえます。

出題範囲について

バイオインフォマティクス技術者認定試験では出題範囲を明示してくれているため、膨大な生命科学の知識と情報科学の知識をある程度しぼって学習することが出来ます。それらの明示されている分野について紹介していきます。

・生命科学分野
生物学基礎 、分子生物学・生化学 、バイオテクノロジー

・情報科学分野
コンピュータシステム 、アルゴリズム、データベース技術、確率・統計、機械学習

・バイオインフォマティクス
分子生物学、配列解析、タンパク質 / 立体構造・機能解析、進化・遺伝、オーミクス

どうでしたか?非常に分野が広いと感じた方もいるかもしれませんが、バイオインフォマティクス技術者認定試験の公式サイトではさらに細かな分野を指定してくださっているので興味がある方はぜひ参考にしてみてください。

バイオインフォマティクス技術者認定試験 公式URLは、こちらからご覧ください。
>>バイオインフォマティクス技術者認定試験 公式URL

バイオインフォマティシャンの就職について

ビルと人

バイオインフォマティシャンになったとして、その後の就職先がイメージできないという方も多いと思います。
しかしバイオインフォマティクスの需要が急増している現代では、バイオインフォマティシャンには様々な道がひらけています。

バイオインフォマティクスをおこなう研究者

バイオインフォマティシャンの就職先として真っ先に考えられるのは研究者です。
しかし研究者といっても、大学の研究員に限った話ではありません。現在は様々な企業の研究チームでバイオインフォマティクスに精通した人材を募集にかけています。
『バイオインフォマティクス 就職先』で検索すると驚くほど多くの求人が出て来ることが分かります。
その多くが研究員の募集であり、必要とされるスキルとしてタンパク質のモデリングやゲノムのデータ解析などを挙げている場合が多いです。正社員で募集している場合が多く、提示されている年収は大体400万~1000万です。
日本の平均年収が400万円ほどとされている現状を考えると、バイオインフォマティシャンの年収は総じて高い傾向にあることが分かると思います。

IT企業のエンジニア

パソコン

バイオインフォマティシャンの必須スキルとしてあげられる情報科学分野のスキル、例えばアリゴリズムの作成やデータベースを利用する際のSQLのスキル、またPythonなどの機械学習のスキルは、IT分野において非常に重宝されています。
そもそも現代はバイオインフォマティシャンに限らずエンジニアの不足も深刻なので、バイオインフォマティクスを行う際の情報処理技術を身についていると、エンジニアとしての就職も十分可能です。
特にアリゴリズムを作成するスキルや機械学習のスキルは、近年話題となっているAIを開発する際にも必須のスキルです。バイオインフォマティシャンとしてだけでなく、エンジニアやプログラマーとしての新たな道も開けるというのが、バイオインフォマティクスを学習する上での大きなメリットであるといえます。

まとめ

男性と女性が試験管を覗く

いかがでしたか?
近年需要が急増しているバイオインフォマティクスについて紹介してきましたが、バイオインフォマティクスを修めることは非常に大変なことです。
しかしその分、バイオインフォマティクスに精通した人材には、様々なジャンルへの活路が開かれています。具体的には研究者やITエンジニアなど、生命科学と情報科学それぞれの分野での活躍が期待できるのです。バイオインフォマティクスは生命科学の現象を情報科学の技術を用いて解析するものなので身に着ける知識量やスキルは膨大ですが、学習の足がかりとなる認定試験なども用意されていて、徐々にではありますが人材育成の基盤が築かれてきています。今後さらなる需要が見込まれるバイオインフォマティクスの発展に要注目です。

ここまでご愛読いただきありがとうございました!

よろしければ弊社SNSもご覧ください!
Twitter https://twitter.com/crystal_hal3
Facebook https://www.facebook.com/クリスタルメソッド株式会社-100971778872865/

AIブログ購読

 
クリスタルメソッドがお届けする
AIブログの更新通知を受け取る

Study about AI

AIについて学ぶ

  • 「Diffusion Transformers (DiTs)」とは。わかりやすく解説

    「Diffusion Transformers (DiTs)」とは。わかりやすく解説

    「Diffusion Transformers (DiTs)」とは Diffusion Transformers (DiTs) は、画像生成における新しいアプロ...

  • 3D画像での異常検知システム(3DのAI・深層学習)

    3D画像での異常検知システム(3DのAI・深層学習)

    3DのAI・深層学習 3Dデータとは? 写真等の一般的な2Dデータは、ピクセル(画素)の縦×横の2次元の配列です。では3Dデータはどの様に表現されるのでしょうか...

  • AI問題点を分かりやすく解説!新たな技術の課題とは?

    AI問題点を分かりやすく解説!新たな技術の課題とは?

    AI(人工知能)は革新的な技術である一方で、さまざまな問題点も浮かび上がってきました。本記事では、AIの問題点についてわかりやすく解説します。 AIの急速な発展...

View more