[バイオインフォマティクス初心者向け講座#1] バイオインフォマティクスをやるのに必要なもの
- 次世代シーケンス解析ラボ
- Oct 22, 2022
- 3 min read
Updated: Nov 3, 2022
バイオインフォマティクスを自身でやってみたい方向けの紹介記事です。
目次
バイオインフォマティクスとは
biology (生物学) と informatics (情報学)を組み合わせた用語で、生物の持つ膨大なデータ
を操るというような意味合いです。
本ブログでは、主に次世代シーケンサーより得られる膨大なゲノム情報や転写産物情報の処理について紹介していきます。
パソコンはなんでもいいのか?
バイオインフォマティクスをやるにあたって最も大事なものはパソコンです。
では、Mac や Windows でもなんでもいけるのか?
おすすめは Mac です。
理由は、解析用のツールが Linux や Mac にのみ対応したものが多いからです。
Windows では無理なのかというと、Linux 環境を無理やり用意する方法を勉強するか、Linux 環境のサーバーをレンタルすることで、解析をすることができると思います。
パソコンのスペックについて
パソコンのスペックは非常に重要です。
メモリ(ストレージとは違います)が少ないパソコンでは、うまく解析できないことが多々あります。
解析対象とする生物種にもよりますが、より良いパソコンまたはサーバーを使うことをお勧めします。
当ブログでは、ファイル容量を抑えた仮想データを用意してバイオインフォマティクスを練習していくことができるので、練習に関してはどんなパソコンでも大丈夫です。
サーバーについて
メモリが大きいパソコンは、費用がかかります。
そんな場合は、サーバー(スパコン)をレンタルして、解析することも検討しましょう。
スパコンをレンタルすることで、ネット環境さえあればどこからでも遠隔でスパコンにアクセスして、作業することができます。
メモリがかかる処理をスパコンでやることでハイスペックなパソコンがなくても、解析することができます。
大学機関のユーザーであれば、国立遺伝学研究所のスパコンを無料で使用可能です。
大学機関以外の方は「スパコン レンタル」で Google 検索してみましょう。
私自身、レンタルしたことがないので、どのぐらいのコストになるのかよく分かっていないですが、もし買ったパソコンでメモリが足りずにできない作業が出てきてしまうとサーバーをレンタルする必要が出てくると思います。
結論
・環境は Mac か Linux がいい。
・メモリが高いパソコンを用意するか Linux サーバーをレンタルする。
私自身は、メモリ 64 Gb の Mac mini と国立遺伝学研究所のスパコンを使って解析しています。
最初の準備が非常に大変だと思いますが、まずは、メモリを気にせずに Mac または Linux 環境を用意して、解析練習をしてみるのもいいかと思います。
手応えを感じてから自分のデータで試してみて、メモリが必要であればハイスペックなパソコンやサーバーを準備しましょう。
Commentaires