
6. 故障予知のアプローチ
6.2 教師あり・教師なし学習の使い分け
機械学習の大きな分け方として、教師あり学習と教師なし学習がある。違いは「正解(ラベル)があるかどうか」であり、教師あり学習はラベル付きデータで予測や分類の規則を学び、教師なし学習はラベルなしデータから構造やグループを見つける方法である。教師あり学習は、入力に対する望ましい出力が与えられ、それに近づくように誤差を小さくする訓練を繰り返すのが基本で、分類や数値予測に向く。教師なし学習は、データの似ている点・違う点を手がかりにクラスタ分けしたり、次元圧縮で特徴を要約するなど、データの内在するパターンの把握に向く。[1][2][3][4][5][6]
故障予知でどちらを使うべきかは、ラベルの状況と目的で決まる。明確な正常・異常ラベルが十分に集まるなら、教師あり学習で分類器を作るのが最も直接的で、どの特徴が判断に効いたかも評価しやすい。一方、現実には異常は稀で、種類も多様で、網羅的にラベルを作るのが難しいことが多い。こうした場面では、教師なしまたは「正常だけを学ぶ」一クラス型のアプローチが実務に適する。One-Class SVMのような手法は、正常データの分布や境界を学び、それから外れるものを異常とみなす代表例で、異常のラベルがなくても学習できる。[4][7][5][8][9][10][6]
両者の位置づけをわかりやすく整理する。教師あり学習は「正解と照らして学ぶ」ため、十分なラベルと代表性あるデータがあるときに高い精度を発揮する。教師なし学習は「正解なしで構造を学ぶ」ため、新しい種類の異常や未知のパターンが潜む可能性に対して柔軟に探索できるが、発見したグループや外れの解釈は人が行う必要がある。さらに現場では、ラベル付きデータとラベルなしデータの両方を使う半教師あり学習も有力で、少量のラベルから出発し、未ラベルを活用して精度や頑健性を高める発想が実用化されている。[2][3][11][5][12][13][14][4]
もう一歩踏み込んで、異常検知タスクに合わせた使い分けの指針を述べる。1) ラベルが豊富(正常・異常とも十分)なときは、教師あり学習で分類器を構築し、再現率や適合率を重視して閾値を運用側と調整する。2) 正常が大量・異常がほぼ無い(または極少)のときは、One-Class SVMや他の一クラス法で正常領域を学び、逸脱を検知する。3) 正常に少量の異常ラベルや「疑わしい」例が少し混ざる現実では、半教師あり学習を併用し、未ラベルも活用して性能を底上げするのが有効である。最近の報告では、分布の不一致(ラベル付きと未ラベルの分布が異なる)を想定した半教師ありの枠組みが提案され、未ラベルに擬似ラベルを与えて堅牢に異常検知性能を高める手法が示されている。[11][7][15][5][9][13][14][10][6][4]
教師あり・教師なし・半教師ありの長所短所を、運用視点で噛み砕く。教師ありは「何が異常か」を明確に学べるが、異常例の収集・ラベル付けのコストが大きく、未知の異常への外挿は苦手になりやすい。教師なしは「いつもと違う」を見つけるのが得意で、未知の異常にも反応しやすいが、何が原因かの説明は別工程(可視化、特徴の確認)が必要で、閾値設計や誤警報の扱いに工夫が要る。半教師ありは両者の間を取り、少量ラベルの情報を軸に未ラベルを取り込むことで、ラベルコストと汎化のバランスを狙うアプローチである。[3][5][12][13][14][6][2][4][11]
「現場でどう選ぶか」の具体的な流れを提案する。第一に、データとラベルの棚卸しをする。正常ラベルの量、異常ラベルの量、未ラベルの量と期間、運転条件の分布を点検する。第二に、目的を決める。見逃しを最小にしたいのか(高再現率)、誤警報を最小にしたいのか(高適合率)、両者のバランス点はどこかを合意する。第三に、方針を選ぶ。異常ラベルが乏しければ一クラス法を軸にし、少量の異常があるなら半教師ありを重ね、異常が豊富なら教師ありを主軸にする。第四に、評価分割は層化や時系列分割を用いて偏りを防ぎ、PR曲線やROCで閾値を調整する。最後に、運用での分布変化に備えて、未ラベルの継続取り込みや再学習の仕組みを用意する。[7][15][5][13][14][10][6][4][11]
代表的なアルゴリズムの例を挙げる。教師ありでは、ロジスティック回帰やツリー系、SVMなどの分類器が標準的で、十分なラベルがあるときに威力を発揮する。教師なしでは、クラスタリングや次元圧縮に加え、異常検知ではOne-Class SVMやIsolation Forestなどが広く使われる。半教師ありでは、少量ラベル+多数未ラベルで学ぶ一般枠組みに加え、PU学習(正例+未ラベル)やPNU学習(正例・負例・未ラベルを組み合わせる)などの構成が紹介されている。さらに、未ラベルに擬似ラベルを与え、一クラス分類器のアンサンブルで堅牢化する枠組みも提案され、分布不一致の現実的条件で高性能を示したと報告されている。[15][5][16][17][18][10][6][4][11][7]
最後に、選定時の注意点をまとめる。- 評価は正解率だけに頼らず、再現率・適合率・F1、PR-AUCなど不均衡に強い指標を用いる。- 教師なし・一クラス法では、正常データの質とカバレッジが性能を左右するため、運転条件ごとの基準化やデータ漂移の監視を設ける。- 半教師ありでは、ラベル付きと未ラベルの分布差(現場で起こりがち)を意識し、その差に頑健な方法(擬似ラベルやアンサンブル等)を検討する。- どの方式でも、特徴量設計と前処理(正規化、欠損処理、ウィンドウ分割)の一貫性を保ち、学習用統計でスケーリングして検証・本番へ適用する基本順序を守る。[5][9][14][10][6][4][7][15]
要するに、使い分けの軸はラベルの入手性と目的の優先度である。十分な異常ラベルがあるなら教師あり、異常が稀なら教師なし(一クラス)、少量ラベルと大量未ラベルがあるなら半教師ありを主軸に据える。運用では、分布変化に備えて未ラベルの活用と再学習サイクルを組み込み、評価は不均衡に強い指標で行う。これらの原則は、機械学習の基本解説や異常検知の実務記事の整理と整合しており、故障予知の現場にそのまま適用できる考え方である。[4][7][5] [1] https://avinton.com/blog/2017/11/supervised-and-unsupervised-machine-learning/
[2] https://ai-kenkyujo.com/artificial-intelligence/kyoushiarigakusyu-kyoushinasigakusyu/ [3] https://ledge.ai/articles/unsupervised [4] https://www.alteryx.com/ja/glossary/supervised-vs-unsupervised-learning [5] https://cloud.google.com/discover/supervised-vs-unsupervised-learning?hl=ja [6] https://cyber-intelligence.co.jp/blog/post-26444/ [7] https://www.chowagiken.co.jp/blog/anomalydetection_introduction [8] https://qiita.com/kznx/items/434d98bf1a0e39327542 [9] https://products.sint.co.jp/aisia-ad/blog/use-one-class-svm [10] https://www.geolab.jp/documents/column/ai-005/ [11] https://aismiley.co.jp/ai_news/supervised-learning/ [12] https://fastlabel.ai/blog/ai-training [13] https://aismiley.co.jp/ai_news/supervised_learning/ [14] https://aws.amazon.com/jp/compare/the-difference-between-machine-learning-supervised-and-unsupervised/ [15] https://webbigdata.jp/post-17867/ [16] https://qiita.com/dcm_ishikawa/items/584cd373f49dd917566a [17] https://note.com/mindful_otaku/n/n45b52a80b862 [18] https://qiita.com/maskot1977/items/4cd822d5d4d021547976 [19] https://xtrend.nikkei.com/atcl/contents/18/00163/00004/ [20] https://doda.jp/engineer/guide/it/045.html※本ページは、AIの活用や研究に関連する原理・機器・デバイスについて学ぶために、個人的に整理・記述しているものです。内容には誤りや見落としが含まれている可能性もありますので、もしお気づきの点やご助言等ございましたら、ご連絡いただけますと幸いです。
※本ページの内容は、個人的な学習および情報整理を目的として提供しているものであり、その正確性、完全性、有用性等についていかなる保証も行いません。本ページの情報を利用したこと、または利用できなかったことによって発生した損害(直接的・間接的・特別・偶発的・結果的損害を含みますが、これらに限りません)について、当方は一切責任を負いません。ご利用は利用者ご自身の責任でお願いいたします。