あらゆる業界においてビッグデータを解析して業務に活用することが普及しつつあります。この記事ではビッグデータの定義や概要、AI(人工知能)との関係性など基本的な情報に加え、製薬業界でビッグデータを活用するメリットや活用の具体例や今後の課題について紹介します。
そもそもビッグデータとは
「ビッグデータ」とは一言で言えば「巨大なデータ群」という意味です。具体的には気温や湿度など各種のセンサーによって刻一刻と記録されるデータや、金融市場の株価変動などのデータ、各種SNSに投稿された内容、ネット上に保存された動画や写真など、あらゆるデータ群すべての集合がビッグデータであると言えます。
前世代のデータにはないビッグデータの特性としてしばしば挙げられるのは「データ量が膨大(Volume=量)」「データの種類が幅広い(Variety=多様性)」「データの発生や更新の頻度が高い(Velocity=速度)」という「3つのV」です。ICTの急速な発展により、それまでの常識では処理しきれなかったこれらの膨大なデータ群を解析することが可能になりました。そして、こうしたビッグデータの分析結果が製品開発やマーケティングなどあらゆる分野で活用されるようになっています。
ビッグデータ活用への大きな転換点になったのがAI(人工知能)技術の発達です。
ビッグデータとAIの関係性
ビッグデータの活用はAI(人工知能)の発展と密接に関連しています。
まず、膨大なデータ群であるビッグデータの解析にはAIの力が必須です。各種のセンサーを付けた機器がインターネットにつながるIoT(モノのインターネット)の普及などもあり、幅広い分野で大量に収集・保管できるようになったデータの分析は人間の力だけではとうてい不可能で、高性能なAIの活用が不可欠になっています。特に、画像や音声などのデータ分析はAIによって目覚ましい進歩を遂げており、医療分野でも画像診断などで大いに活用されています。
一方、AIそれ自体にとってもビッグデータは欠かせない存在です。AIとはつまり「大量のデータを分析して物事を予測したり問題解決方法を見つけたりするコンピュータ技術」と言うことができますが、AIがその分析能力を発揮するためには、大量のデータを使用した「学習」をあらかじめ行う必要があります。
AIの性能が格段に飛躍するきっかけになったのは、コンピュータが自らデータのパターンやルールを発見して学習する「ディープラーニング(深層学習)」が機械学習に取り入れられるようになったことです。ディープラーニングは大量のデータを取り込んで学習を積み重ねて予測精度を上げていく仕組みになっているため、学習に使うデータが多ければ多いほどよいといえます。このAIが欲する大量の学習データの供給元となるのがビッグデータなのです。
このように、ビッグデータの活用とAIの発展は切っても切り離せない関係にあるのです。
製薬業界におけるビッグデータ×AI活用への期待
では、製薬業界ではビッグデータとAIがどのように活用されているのでしょうか。ここでは事例を挙げながら解説します。
新薬の開発
ビッグデータとAIの活用は新薬の開発プロセスにも変化をもたらしています。特に、個々の患者によって症状や進行の度合いの違いが大きいがん治療の分野で大きな役割を果たしています。
がんは遺伝子の何らかの異常が原因で起きる疾患であるため、現代の治療では、がんを引き起こす原因を遺伝子レベルで探り当てて、一人ひとりに最適な医療を行う「個別化医療」の試みがなされています。そのためには30億セットの塩基対からなる人間の遺伝子情報すべて(ヒトゲノム)の配列の解析を一人ひとりについて行う必要がありますが、AIに任せることでこの解析が可能になり、個々の患者の体質や病状に合わせた薬の開発が実現できると考えられています。
開発費の大幅な費用削減
創薬における大きな課題は、開発の成功確率を高めることにあります。そのために重要な要素の一つは膨大なデータを紐解き、精度の高い標的の選定を行うことです。
まず、新薬の候補となる化合物をリストから探し出すためのシミュレーションにAIが大きな役割を果たすようになっています。既存の化合物や、未知の化合物のデータを、生体のタンパク質や30億対からなるヒトゲノムのデータと突き合わせて行う結合予測が、AIを利用することで低コストかつ短期間のうちに実現することが可能になったのです。
また、AIにさまざまなデータを分析させて新薬開発における臨床試験(治験)の設計や、被験者候補の絞り込みに生かすことで、リサーチなどにかかる費用の大幅な削減につなげることも可能になっています。
効率化・生産性の向上
ビッグデータとAIを活用して、製薬業界の業務フローを効率化して生産性を向上させることも行われています。特に、ルーティン的な作業はAIによる自動化や効率化の恩恵が大きい分野であると考えられます。
また、カスタマーセンターではAIを組み込んだチャットボットの活用も進んでいます。質問に関するデータをAIに学習させデータを蓄積することで、今まで人間のオペレーターに依存していた業務の大部分をAIの応答に任せることができるようになっています。そして、AIでは対応できない質問の場合のみオペレーターに切り替えるなどの対応を行うことで、対応の品質を保ちつつ、組織全体の生産性向上につなげることが可能になったのです。そのほか、MRの営業支援としてもビッグデータとAIによる分析の活用で、医師の処方の傾向や処方内容の変化、MRの各メンバーの活動などを分析して可視化を行い、最適な相手に最適なタイミングで最適な情報を提供する「全体最適化」を目指すことができるようになっています。
実用化にはまだまだ課題も
ビッグデータ×AI活用の本格的な実用化にあたっては、まだまだ解決すべき課題も残されています。
プライバシーの保護
医療データは個人情報の最もセンシティブな部分であることから、活用する際には慎重な取り扱いが必要です。個人を特定する情報をマスキングして活用していくことが大きなポイントになります。今後においては、暗号や認証機能を組み合わせたブロックチェーン(分散型台帳技術)の利用など、プライバシーへの配慮とデータのさらなる利活用の両方を成立させる技術やルールを確立することが求められています。
データ収集のために各社連携が不可欠
医療に利用するために質量ともに十分なデータを収集するためには、各医療機関や製薬会社が連携し、それぞれのデータを相互に利用できる体制を構築することがポイントになります。単体では価値がないと考えられている自社保有データでも、他の政府公開データなどと組み合わせることで価値が生まれることがあります。
しかし、現状ではデータの形式が各機関によって異なるなどの理由で、有用なデータがあってもAIの学習データやAIの解析対象データとして生かすことが難しくなっています。
各機関が持つデータを共有して利用できる仕組みの構築に大きな期待が寄せられています。
システム構築には人手・費用が必要
ビッグデータとAIを活用していくには、ICTシステムの構築が不可欠です。高性能のAIを機能させるには、相応の能力を備えたサーバーやデータセンターなどの設備投資が必要になります。加えて、社外とも連携できるネットワークを構築するとなるとコストはさらに跳ね上がります。こうした初期費用やランニングコストは基幹業務システムやマーケティング、創薬に特化したクラウドサービスの利用で抑えられる場合もあります。実際の現場で役立つシステムの構築に向けて、コストなどを考慮して落としどころを定めつつ、計画を進めていくことが大切です。
まとめ
製薬業界でも、開発や販売において、AIの導入やビッグデータを活用するなどの動きが進んでいます。テクノロジーの利用にはコスト削減などのメリットがある一方、企業の壁を超えたデータ連携やプライバシーへの配慮などクリアすべき課題も多く残されています。今後の成長につなげるための各社の手法が注目されています。