現在ではAIやビッグデータの発展に伴い、AIの精密なデータ分析能力などが医療の分野に応用され始めています。とりわけヒトゲノム解析の発展は著しく、多くの医療機関でヒトゲノム解析が取り入れられつつあります。本記事では、ヒトゲノム解析の概要や、ゲノム解析を可能にするテクノロジー基盤について詳しく解説していきます。
ヒトゲノム解析はヒトの遺伝子構造を解読する行為
ゲノムは、遺伝子(gene)と染色体(chromosome)を合わせた言葉です。ヒトゲノムとは人の細胞の核にあるDNAの塩基配列で表された1セットの遺伝情報で、この塩基配列が人間の性格や見た目、病気に対する強さなどを決定すると考えられています。
ヒトゲノム解析とは、塩基の順番からなるヒトゲノム情報を解析して、人間の姿や性格、病気などにどう影響するかを予測、解明することです。ヒトゲノム解析によって解明された遺伝情報は、病気の予防や治療、新薬の開発などに活用されます。
ヒトゲノム解析が注目される背景
これまではヒトゲノム解析に膨大な費用や時間がかかっていました。しかし近年では、ゲノム情報のビッグデータを解析できる人工知能の開発によってさまざまなゲノム解析が可能になり、その高速化も実現しつつあります。
AIを活用したヒトゲノム解析では、大幅にコストを削減しながら人の遺伝子を構成している、30億対以上の塩基の並び方についてデータを収集・比較分析が可能です。精度の高い分析・判断によって遺伝子の塩基配列に生じている変異の特定までが可能になり、今後は発生している症状との関連からゲノム解析による病気の診断ができるようになるといわれています。過去データから得られたAI予測により診断から治療方針の決定までAIが行える環境が実現すると、医療分野のコスト削減や労働環境の改善にも役立ちます。
AI、機械学習、ディープラーニングといった人工知能は、まだまだ成長が見込める分野です。より効果的にゲノム解析によりデータを活用した病気の診断・治療が可能になることが期待されています。
医療分野へのAI導入の手順
医療分野へAIを導入する際には、デバイスを決定する「取り込み」やデータ活用を可能にする「変換」、データから結果を見つけるための「探索」、テストから実際の導入までの工程を行う「トレーニング」「実際の推論」などの手順で行われます。適した方法で段階的にAIを導入し、AIを効率よく医療に活用できる環境を構築しましょう。
取り込み
AI導入時には、最初に、IoTに接続された医療機器にAIを取り込む必要があります。これまでも心電図などAIの自動診断システムが組み込まれた医療機器はあり、検査結果をデータに取り込むために使用されてきました。現在では、心拍数などの音を拾うスマートスピーカーや聴診器、X線、CT、MRIなどの医療画像を撮影する機器、採血を行うロボットといったさまざまな医療機器にAIが取り込まれています。デバイスから取り込まれたデータはネットワークの末端で作成され、その後の診断などに使用されます。AIを活用する予定の診断に関係する医療機器を決定し、必要な機器を導入します。
変換
医療機器から取り入れたデータは、あとでAIによって管理できるように正規化しなければなりません。収集したデータはクラウド内のデータレイクのなかでそのままの形式で保管され、その後前処理のため正規化されます。AI導入時には、データがどれだけの期間必要か、どこまでデータを集める必要があるのかを把握することが大切です。AIの予測結果がどのシーンで必要になるのかなど、診断に必要な情報を明確にしておくとデータの変換が最適に行えます。
探索
AI導入時における探索とは、目的の状態に達するまでの変化をパターンごとに確認しながら探し出すことです。この段階で、準備したデータセットから診断、完治など希望する結果を引き出せるパターンを見つけます。画像やテキスト、音声データなどのデータを大量に蓄積して解析能力を高めるディープラーニングには種類があるので、AIのディープラーニングモデルの選択も重要です。
トレーニング
トレーニングの段階では、構築したモデルが順当に結果を出せるかについて検証します。モデルを実行した場合にAIによる予測が高い精度で行われるのかを検証するほか、正しい方法でモデル操作が行えるように、操作する人間の研修も必要です。
コンピューターシステムへの負荷、読み取り・書き込み時のI/O負荷の状態に無理がないか、モデルのライフサイクルを反復してトレーニングを実施します。また、操作方法について研修を行ったりマニュアルを作成したりして、正しいAIの活用方法を浸透させることが重要です。探索段階で推論モデルを構築してからは、将来的に収集したデータを使ってデータがより精度が高い参考データを充実させるため、トレーニングクラスタへデータを定期的に取り込み続けます。
実際の推論
推論とは、既に与えられた知識を元に予測される事態を予想して論じ、答えにたどり着くことです。推論の段階では、上記を経てトレーニングが完了したあとで実際にシステムを実践導入して希望どおりの結果が得られるか確かめます。
導入時、推論モデルは一般的に、開発と運用双方が効率よく業務に取り組めるDevOps型のリポジトリーに保存されます。DevOpsは、通信状態を良好にアクセス速度を高速に保てる低レイテンシーが特徴で、安定したサービスが保持されやすいため、データボリュームが増えた際にも処理速度に大きな問題は生じません。
NetAppのクラウドサービスでヒトゲノム解析を可能に
NetApp(ネットアップ)は、1992年に設立したアメリカに本社を置くクラウドデータサービス、ストレージシステム、ソフトウェアを提供する企業です。世界最大、最高のクラウドを提供できる業界トップのソリューションとして知られています。
膨大なゲノムデータの分析、データへのアクセスにはタイムアウトやファイル障害などの問題が生じやすいなか、データへの高い反応速度を維持できるのがNetAppのサービスです。オンプレミス展開と統合も可能で、強力なセキュリティなどさまざまな優れたサービスが活用できます。NetAppのクラウドストレージサービスでは、エッジ、コア、クラウド全てのソリューションを提供しています。NetAppの高性能な医療業界向けクラウドサービスを以下に紹介します。
- エッジ ソリューション「 NetApp ONTAP Select」
高性能な機能を有するONTAPソフトウェア。汎用サーバーやハイパーバイザー、メディア上でも使用可能な、幅広い環境で活用できるサービスです。 - コア データセンター ソリューション「NetApp AFF(All Flash FAS) A800」
200マイクロ秒未満の超低レイテンシー、最大300GBpsの圧倒的なスループットの高性能ソリューションです。要件の厳しいAIトレーニングにも対応可能で、より高度な分析も快適に行えます。 - クラウド ソリューション:「クラウドデータサービス」
NetAppのクラウドデータサービスでは、優れたデータ管理機能、NFS機能を提供しています。
NetAppのクラウドストレージサービスは医療業界に最適な機能が活用できるサービスです。膨大なデータを扱うヒトゲノム解析業務のパフォーマンス向上を可能にします。
事例: 世界最大級のヒトゲノムデータ(WuXi NextCODE)
ゲノムデータの解析や保管を手がける世界的な企業がWuXi NextCODEです。WuXi NextCODEはアメリカのケンブリッジ(マサチューセッツ州)に本社を有する企業で、ゲノムデータの体系化、探索、共有、応用などを行うプラットフォームの運用を行っています。人々の健康増進のために分析、保管しているゲノムデータベースは世界最大級を誇ります。
WuXi NextCODEでは、今後もどんどん増え続けるヒトゲノムの膨大なデータや臨床データの保管に、NetAppのクラウドサービスを活用してビッグデータへのアクセスや分析など処理にかかる時間を軽減しています。NetAppのクラウドストレージサービスは、大手クラウド・プロバイダ各社のサービスを利用できるマルチクラウドです。マルチクラウド戦略によりネットワーク性能を高め、ボトルネックをなくしてスピーディーな情報へのアクセスを可能にし、WuXi NextCODEのデータ分析の効率化を実現しました。
データ分析の制度が上がると同時に、増加を続けるデータによって、ネットワークやシステムのパフォーマンスの低下が起こります。ストレージの拡張性、パイプラインの柔軟性や既存の顧客システムとの統合が可能なNetAppのクラウドストレージサービスが、パフォーマンスの低下を防ぎ業務をサポートしています。
まとめ
ヒトゲノム解析が進み人間の遺伝情報が明らかになると、人間の病気や遺伝的障害の原因を明確にできる可能性が高まります。ヒトゲノム解析の解析を進めるには、ビッグデータとAIを運用できる優秀なクラウドサービスの活用が必要です。信頼できるNetAppのソリューションをゲノム研究に取り入れてみてはいかがでしょうか。