『音による故障予知の教科書たたき台:7.2 教師あり/教師なしの概要』LLMと一緒に書いてみた—AIが導く研究メモ

7. 機械学習の基本  

7.2 教師あり/教師なしの概要

機械学習には大きく二つの学び方がある。ひとつは正解つきの例から規則を学ぶ「教師あり学習」、もうひとつは正解なしのデータから形やまとまりを見つける「教師なし学習」である。前者は「入力→答え」の対応関係をデータから推定して未知データの予測に使う発想で、後者は「似たもの同士を集める」「本質的な軸で要約する」といった構造把握が目的になる。さらに両者の中間として、少量の正解つきと大量の正解なしを組み合わせる「半教師あり学習」もあり、現実にラベル作成が難しい領域で有力な選択肢になっている。[1][2][3][4][5][6]

まず教師あり学習を平易に捉える。人があらかじめ用意した正解(ラベル)を手がかりに、入力と出力の関係を学び、新しい入力に対して出力を当てる仕組みを作る学習である。画像に「良品/不良」、音に「正常/異常」といった答えが付与されたデータを使って規則を学び、未知の画像や音に対して判定を出す、と考えるとよい。教師ありの代表タスクは二つで、カテゴリーを当てる「分類」と、連続値を当てる「回帰」がある。たとえば故障予知なら、特徴量から「正常/異常」を分類する、あるいは「残寿命」を連続値で予測する、という応用になる。強みは目的に直結する精度の追求がしやすいことだが、十分量で質の高いラベルが必要というコストが伴う。[7][3][5][8][1]

次に教師なし学習を直観で掴む。教師なしは正解ラベルを使わず、入力データだけを渡して「まとまり」や「潜むパターン」を機械に見つけさせる学び方である。データの似ているもの同士を集める「クラスタリング」、データを本質的な軸で小さく要約する「次元削減」、よく一緒に現れる関係を見つける「アソシエーション」などが代表である。クラスタリングの典型はk-means法で、あらかじめ指定したk個の中心に近いデータを割り当て直す操作を繰り返してグループを見つける。次元削減の代表はPCA(主成分分析)で、情報をなるべく保ったまま高次元データを低次元に写し、可視化や前処理に用いる。教師なしの強みは、ラベルがなくてもデータの構造を把握でき、未知の種類にも目配りできる点だが、出てきたグループや軸の意味づけは人が行う必要がある。[9][10][11][12][13][14][5][15][1]

両者の違いは「正解の有無」と「目的の置き方」に集約される。教師ありは正解に近づくことを直接の目的に、損失を小さくするように学ぶ。教師なしはデータそのものの構造把握が狙いで、「どのような群があるか」「どの方向に広がっているか」を探る。実務では、教師ありで目的に直結するモデルを作りつつ、教師なしで前処理や探索(群の把握・外れ値検出・可視化)を支える、といった役割分担がよく機能する。[12][3][5][1][9]

現実のデータでは、正解つきデータが少なく、正解なしデータが大量にあることが多い。そこで両者の良いところ取りをする半教師あり学習が効果を発揮する。基本は「少量のラベル付きで初期の手がかりを作り、未ラベルの大量データで補強する」という二段構えである。ラベル付けはコストが高いが未ラベルは安価に集まる、という現場事情に合致しており、手書きの少量ラベルを土台に未ラベルへ拡張して精度を底上げできる。研究動向でも、未ラベルを活かす一貫性学習や自己学習などの手法が深層学習と組み合わさり発展している。[2][4][16][17][6]

代表的アルゴリズムの顔ぶれを整理しておく。教師ありでは、ロジスティック回帰・SVM・決定木/ランダムフォレスト・勾配ブースティング・ニューラルネットなどが定番で、分類・回帰に広く使われる。教師なしでは、k-meansやガウス混合(GMM)といったクラスタリング、PCAや自己組織化マップ(SOM)などの次元削減・可視化、購買の同時出現を探るアソシエーション(Aprioriなど)が代表である。どの手法も万能ではないため、目的・データ量・雑音レベル・説明性の要求を踏まえて選ぶことが大切だ。[3][14][5][1][9][7][12]

使い分けの基本指針を具体化する。目的に直結した数値やラベルを当てたい、評価指標(精度・再現率など)で厳密に比較したい、といった状況では教師ありを主軸にするのが近道である。一方、未知の群や構造を探索したい、ラベルがないがセグメントを把握したい、前処理として高次元の整理や外れ値の抽出を行いたい、という目的なら教師なしを起点にするのが合理的である。ラベルが少しだけあるなら、半教師ありで未ラベルを活用して精度と頑健性を底上げするのが実務に合う。また、教師なしで得たクラスタや低次元表現を教師ありの入力として活用する「段階的設計」も効果的である。[4][13][5][6][1][9][7][2][12]

注意点も併せて押さえる。教師ありでは、ラベルの品質と代表性が性能を左右するため、ラベル規約の整備と層化・時系列を意識した評価設計が欠かせない。教師なしでは、結果の解釈を人が行う必要があり、クラスタ数の仮定や尺度の選択(距離・標準化)で結果が変わるため、比較検証と可視化を通じた妥当性確認が重要である。半教師ありでは、初期の少量ラベルの偏りが残りの未ラベル学習に伝搬しやすいので、初期ラベルの品質管理や検証セットでの監視が必須になる。[14][5][16][9][7][2][12][4]

故障予知への実装イメージをまとめる。初期段階では教師なしのクラスタリングやPCAで運転状態のまとまりや外れを把握し、センサのスケール調整や特徴選定の当たりをつける。ラベルが集まってきたら、教師ありで正常/異常の分類器や寿命予測モデルを作り、PR曲線など適切な指標で評価する。ラベルが限られる間は、半教師ありで未ラベルを取り込み精度を高める。これらを定期的に見直し、分布の変化に応じて再学習する体制を整えるのが現実的なロードマップである。[13][5][6][7][2][12][4]

このように、教師ありは「正解に近づく予測器を作る学び方」、教師なしは「データの構造を見つける学び方」、半教師ありは「少量の正解を糸口に大量の未ラベルを活かす学び方」と整理できる。目的、ラベルの可用性、運用の制約を踏まえて適材適所で選び、必要に応じて組み合わせることで、現場に根づく予知モデルの基盤が築ける.[1][9][4] [1] https://avinton.com/blog/2017/11/supervised-and-unsupervised-machine-learning/

[2] https://ja.wikipedia.org/wiki/%E5%8D%8A%E6%95%99%E5%B8%AB%E3%81%82%E3%82%8A%E5%AD%A6%E7%BF%92

[3] https://www.alteryx.com/ja/glossary/supervised-vs-unsupervised-learning

[4] https://www.oracle.com/jp/artificial-intelligence/machine-learning/semi-supervised-learning/

[5] https://aws.amazon.com/jp/compare/the-difference-between-machine-learning-supervised-and-unsupervised/

[6] https://www.agaroot.jp/datascience/column/machine-learning/

[7] https://aismiley.co.jp/ai_news/supervised-learning/

[8] https://xtrend.nikkei.com/atcl/contents/18/00163/00004/

[9] https://ai-kenkyujo.com/artificial-intelligence/kyoushiarigakusyu-kyoushinasigakusyu/

[10] https://doda.jp/engineer/guide/it/045.html

[11] https://ledge.ai/articles/unsupervised

[12] https://ai-market.jp/technology/machine-learning/

[13] https://tech.datafluct.com/entry/20220714/1657796580

[14] https://www.sbbit.jp/article/cont1/46835

[15] https://qiita.com/tk-tatsuro/items/1228c90e8803db378f31

[16] https://www.jstage.jst.go.jp/article/tjsai/33/4/33_C-HA2/_article/-char/ja/

[17] https://naist.repo.nii.ac.jp/record/8565/files/R015537.pdf

[18] https://business.ntt-east.co.jp/content/cloudsolution/column-162.html

[19] https://www.datalabelify.com/ja/%E5%8D%8A%E6%95%99%E5%B8%AB%E3%81%82%E3%82%8A%E5%AD%A6%E7%BF%92/

[20] https://www.netattest.com/unsupervised-learning-2024_mkt_tst

※本ページは、AIの活用や研究に関連する原理・機器・デバイスについて学ぶために、個人的に整理・記述しているものです。内容には誤りや見落としが含まれている可能性もありますので、もしお気づきの点やご助言等ございましたら、ご連絡いただけますと幸いです。

※本ページの内容は、個人的な学習および情報整理を目的として提供しているものであり、その正確性、完全性、有用性等についていかなる保証も行いません。本ページの情報を利用したこと、または利用できなかったことによって発生した損害(直接的・間接的・特別・偶発的・結果的損害を含みますが、これらに限りません)について、当方は一切責任を負いません。ご利用は利用者ご自身の責任でお願いいたします。

おすすめの記事