マシンラーニングを使った異常検知の仕組みを解説

異常検知を行う場合、逐一人がデータを関していたのでは非常に労力がかかります。臨機応変に対応できる反面、手動での作業が伴うためミスも生じやすく、時間も浪費しがちです。そこで注目されているのが、マシンラーニングを使った異常検知システムです。ここでは、その仕組みや活用例などを解説します。

→この記事と合わせてチェック！企業がDX失敗する6つの理由とその解決策【無料ダウンロード】

そもそも異常検知とは

異常検知はその名の通り、通常と異なるものを調べることを意味しており、企業活動においては、特に品質管理やシステム管理などで使われる用語です。具体的には、あるデータ群をもとにターゲットとなる特定のデータを調べて、それが問題のないデータか、異常なデータかどうかを調べるのです。膨大なデータを使い、これらと一致しない対象を感知したときにこれを知らせます。

この技術は、製造ラインにおける不良品発生、工場内のマシンの異常動作、不正アクセスの検知などに活用されます。普段とは異なるデータが送られたときには、その内容に即した対応を行います。データであれば、コンピュータ上で処理しますが、ターゲットとなる情報はデジタルとは限りません。たとえば、不正アクセス検知であれば、コンピュータ内の情報が対象となるためデジタルデータを扱いますが、製造過程の商品であれば実在する物体であるため、対応も現実の手段を伴う必要があります。そこで、画像として情報を取り込み、これをデジタル化、データ分析を行うことで異常検知を実現するのです。

なお、普段と異なる状態かどうかを判別するには、高速な情報処理能力、精度の高い解析能力、そして大量のデータを用意しなければなりません。そこで役に立つのがAIです。従来は人が目で見て判断していましたが、それでは処理できる量に限りがありますし、作業する者の力量によって精度に差が生じてしまいます。これでは安定的な品質を維持するのは困難ですし、コスト高になってしまうなど、種々の問題が生じるのです。
しかし、現代ではAIの技術も伸び、さまざまな分野で実用化されつつあります。人では認識することが難しい微細な違いも感知できますし、人のように疲労で精度がぶれることもありません。もちろん、システムの技術水準によって得られる効果には差が生じますし、運用方法には注意が必要です。しかしながら、昨今の異常検知技術は、AIや周辺システムの水準が向上したことによって、そのレベルが向上してきています。

異常検知の主な手法

異常検知の手法にもいくつか種類があります。代表的なのは「外れ値検知」と「異常部位検出」、そして「変化点検知」の3種です。

「外れ値検知」は、通常なら発生し得ないデータを見つけ出すために用いられる手法です。この手法で株価を監視した場合、急激な値上がりや値下がりが生じたときにアラートを発することができるでしょう。シンプルな検出方法であり、これ自体の技術レベルは高くなく、比較的導入が容易です。ただし、外れ値の設定には注意が必要で、その判別を適切に行うためには膨大な量の情報を収集しなければなりません。

「異常部位検出」は、異常が起きている際、その値を検出するのではなく部分時系列を検出します。代表的なのは、心電図のデータのうち異常な部分を抜き出す例です。時系列を考慮し、過去のデータと比較してこれまでと異なる状態であると判定すれば、その部位を抜き出します。

「変化点検知」は、これまでの時系列データと異なるパターンが出たときにこれを検知する手法です。ある検索エンジンにおいて、特定のキーワードの検索数がどのように推移しているのかを調べているとしましょう。大きな変化がないときには予測をした数値の範囲内で推移しています。しかしながら、何かそのキーワードに関する出来事があったときには、検索数の急激な増加が発生し、予測から外れた推移を見せることがあります。この予測からの外れを検知することで変化点を調べます。

マシンラーニングを使った異常検知の仕組みと手法

高度な異常検知を実現するためにはマシンラーニングの技術が欠かせません。そしてその背景には「ホルテリング理論」「k近傍法」「局所外れ値因子法(lof法)」と呼ばれる方法・理論があります。それぞれの内容を見ていきましょう。

ホテリング理論

「ホテリング理論」は統計モデルに基づく、最も有名かつ基本的な異常検知技術です。平均・分散などのデータの分布情報を用い、観測値から算出される異常度で外れ値かどうかを調べています。

ただし、複数の山を持つ分布の場合など、異常な値かどうかを正常に判断できないケースがあるため、この手法のみでは精度の高い検出ができないこともあります。

k近傍法

ホテリング理論ではある状況下において異常値を検出できないことがあることは先に述べた通りです。その理由は、データが正規分布から生成されていると仮定していることに由来しています。そこで確率分布を明示的に仮定するのではなく、各点からの距離を計算し、その距離が一定以上に達すると異常値であると判断する「k近傍法」が使われます。k近傍法であれば複数のクラスターからなるデータであっても検出が可能です。

局所外れ値因子法(lof法)

「k近傍法」だと、データの性質によっては閾値の設定が簡単ではありません。たとえばクラスター内の密度が異なる場合には精度が落ちてしまいます。そこで用いられるのが「局所外れ値因子法」です。この方法ではデータの密度が異なるクラスターがある場合において、他方のクラスターのデータをすべて異常値と判定しないようにすることができます。

異常検知の活用例

異常検知はさまざまな場で活用されています。外観検査で使われることもありますし、カードの不正利用、不正アクセス、異常動作の検知などでも使われます。
外観検査として用いられる場合、検知システムを駆動させることで属人性をなくし、常に一定のクオリティで問題を検知できるというメリットがあります。スピードも格段に向上させられ、人件費の削減なども期待できます。

カードの不正利用に関して、たとえば三井住友カードであれば24時間常にカードのモニタリングが行われており、不正な利用という異常を素早く検出し、本来の利用者が受ける被害を最小限に抑えられるようにしています。

また外観検査でも取り入れられている手法ですが、カメラからの映像データをもとに異常動作の検知ができるようになっています。この異常動作は、工場におけるマシンの動作以外に、人の動作を含むケースもあります。これを応用すればサイバーセキュリティのみならず、物理的なセキュリティ水準の向上も可能で、本来とるべきではない行動をとった者を調べるといった使い方もできるでしょう。人が立ち入ってはいけない危険な場所に同システムを組み込むことで、緊急停止したり、事後の対応が素早くできるようになったりします。

AIを活用したDX実現を支援する「スカイディスク」

AIを使った外観検査はもはや未来の技術ではなく、広範な企業でも導入可能なものになっています。株式会社スカイディスクはAI外観検査機を提供しており、目視に頼った検品業務をAIがサポートしてくれます。同社はこのAI外観検査機のほか、生産スケジューラなど、さまざまな製品・サービスを開発し、近年注目されているDXの実現を支援しています。

また、これまで100社以上、200件以上のDX支援実績を有する国内企業ですので、依頼する際にも安心感があります。

実際の導入事例としては、以下のようなものがあります。

ある企業では、製造過程で不良品が発生していましたが、設備がどのような状態のときに不良品が発生してしまっているのか不明瞭であるという課題がありました。そして、常に人が張り付き、全数検査をしていたのです。しかし、スカイディスク社のサービスを導入して不良品発生の要因を分析・予測するAIモデルを作成することで、不良品が発生しそうなタイミングをAIが予測できるようになりました。さらに、その判断根拠をダッシュボードに可視化させ、全数検査を不要にできました。結果として検査工数は大幅に削減できるとともに、検査員の同時対応可能範囲が広がり、生産性向上にもつながっています。

中小企業でも導入しやすい、月額モデルのSaaSプロダクトを提供していますので、ぜひチェックしてみてください。

まとめ

異常検知はマシンラーニングを活用することで効率・効果を向上させられます。スカイディスク社の異常検知システムを導入すれば、人の手で一つひとつ検査する必要がなくなる上、データの収集・分析を行う流れが確立できるため、DX実現にも寄与するでしょう。

マシンラーニングを使った異常検知の仕組みを解説