『音による故障予知の教科書たたき台:6.1 正常・異常の定義』LLMと一緒に書いてみた—AIが導く研究メモ

6. 故障予知のアプローチ  

6.1 正常・異常の定義

故障予知の出発点は、「正常」と「異常」を現実に観測できるデータの上でどのように区別するかを決めることである。この区別が曖昧だと、どれほど高度な解析や学習手法を使っても判断がぶれてしまう。正常とは、機器が設計意図どおりの性能・安全性・品質で動作している状態に対応するデータ範囲を指し、異常とは、その範囲から有意に外れた挙動や、将来の故障モードへつながる兆候を含むデータを指す、とまず素直に捉えるとよい。実務では、正常の“許容ばらつき”を含めて定義し、逸脱の大きさや継続時間に応じて「注意」「警報」「停止判断」のような段階的な基準(しきい値)を整えるのが定石である。この考えは機械の状態監視・診断に関する国際規格の一般指針とも整合しており、監視パラメータの選定とアラーム基準設定が重要とされる。[1][2]

定義づけの第一歩は、対象設備と故障モードの棚卸しである。どのパラメータ(振動、温度、圧力、電流など)を監視すれば、性能・安全・品質に直結する変化を捉えられるかを整理し、正常運転の条件と許容範囲を明文化する。状態監視の標準的ガイダンスでは、監視パラメータの選定、データ収集、警報値の設定、診断・予測の手順が体系化されているため、これを下敷きにすることで「どの値がどれだけ逸脱したら異常か」を段階づけしやすい。アラームの段階(注意・警報・トリップ)を定義し、トリップ設定点は安全側に、注意・警報は予兆の早期検知に使う、といった使い分けが推奨されている。[2][1]

データの世界での定義には三つの代表的な立場がある。第一は、正常領域をしっかり定義し、その領域からの乖離を「異常」とする立場である。異常例が少ない現場では、正常データが豊富に得られることが多く、正常の分布を学習して逸脱度を指標化し、しきい値で異常判定する枠組みが実務に合っている。第二は、正常・異常の両方について典型パターンが揃っているときに、それらの類似度で判定する立場で、ただし現実には異常の網羅が難しいため適用範囲は限定的である。第三は、明らかな外れ値や突発的な逸脱だけを対象にする外れ値検知の立場で、連続的なドリフトや劣化には弱いが、急な異常イベントの検出に向く。現場では、監視したい現象が「突発(外れ値型)」か「乖離(行儀よいズレ)」かで立場を使い分け、併用する。[3][4][5]

正常の定義において大切なのは、運転条件の違いを取り込むことだ。負荷、回転数、温度、ライン品種などで基準値が変わる場合、すべてを一つの基準に押し込むと誤警報が増える。運転条件ごとに「正常ベースライン」と許容帯を持ち、その中での逸脱を異常とする設計が合理的である。状態監視のガイドラインでも、監視計画の段階で対象機械・運転条件・監視パラメータの対応付けを行い、条件に応じたアラーム基準を設けることが示されている。さらに、データ処理基盤の指針では、データの取り込みから解析・表示までの共通手順を整える重要性が述べられており、定義の一貫性が品質そのものだと理解できる。[6][1][2]

異常の定義は、手段に依存してはいけない。機械学習を用いる場合でも、正常・異常の判断は「モデルがそう言ったから」ではなく、「基準に照らして逸脱があるから」で説明できるべきである。産業分野では、正常のみを学習して異常を検知する枠組みが一般的だが、この場合でも、異常データの網羅が難しいこと、しきい値の根拠や誤警報・見逃しの扱いを事前に検討するよう、ガイドラインで注意喚起されている。定義づけの段階で、どの程度の見逃しは許容し、どの程度の誤警報は業務で吸収するのか、運用のコストと安全側のバランスを合意しておくことが欠かせない。[7][8][1][2]

判定の設計には、しきい値の置き方が要となる。単純なしきい値は分かりやすいが、背景ノイズや季節・負荷によるオフセット変動で振れやすい。そこで、基準化(例えば条件別の平均・分散で標準化)や、短期と長期の比(短期/長期)を用いた適応的なしきい値、複数パラメータの組み合わせ(比・差・合成指標)などを採用すると、正常の幅を保ちつつ異常の感度を上げやすい。実務解説でも、正常パターンからの乖離度を用いる異常検知は、ドリフトのような変化に対応できるが、参照する正常パターンの定義とラベリングが前提になる、と整理されている。これは「正常の定義が先、判定はその上に立つ」という原則の再確認でもある。[5]

正常・異常の定義をデータ駆動で下支えする枠組みとして、正常学習型の一クラス分類や再構成誤差ベースの手法がある。正常データだけで領域を学習し、外側を異常とする一クラス系は、異常が少ない現場に適し、類似度の枠組みで正常領域を柔軟にモデル化できるとされる。また、正常を再現するモデル(オートエンコーダなど)を学習し、再構成誤差が大きい入力を異常とみなす考えは、運転劣化で複数変数の関係が崩れた際にエラーが増えることを利用する。ただし、どちらも最後は「どこまでを正常と認めるか」というしきい値で決まるため、しきい値の決め方(検証データでの分布、目標とする検知率・誤警報率)を定義段階で明記しておく必要がある。[4][9][3]

現場に落とし込むための手順をまとめる。1) 機器・ラインの重要度を踏まえて監視パラメータを選ぶ(振動、温度、圧力、電流、品質指標など)。これは状態監視の基本手順に沿う。2) 条件別に正常のデータを収集・整理し、平均・分散・許容範囲を決める。必要に応じて注意・警報・停止の多段しきい値を設定する。3) 異常の候補事象(故障モード)と、それに対応する症状(側帯域の増加、温度上昇など)の対応表を作る。標準指針は症状と故障の対応例を整えており、参考にできる。4) 判定方式を選ぶ。外れ値型なのか、乖離型なのか、正常領域学習か、異常パターン類似かを、データの可用性に応じて決める。5) しきい値の決定と運用ルール(見逃し・誤警報の扱い、エスカレーション、再学習周期)を合意する。異常データの網羅が難しい点をふまえ、しきい値最適化の手順を検証セットで確立する。6) 定期的な維持更新。経年や設備改修により正常の分布は動くため、基準の見直し・モデル更新のサイクルをあらかじめ設ける。[8][3][4][1][5][2]

最後に、定義の品質を保つための要点を三つ挙げる。第一に、データと業務の整合性である。センサだけでは運転変更や保全作業の影響を区別できないことがあるため、保全記録や運転ログと突き合わせて「データ上の変化が設備由来か運用由来か」を区別する体制を持つ。第二に、説明可能性である。正常・異常の判定根拠は、しきい値や症状の増減として説明できる形で文書化し、監査可能にする。産業向けの指針は、アラーム基準や予測の概念を文書で共有することを推奨している。第三に、安全側の設計である。判断誤りには「誤警報」と「見逃し」があり、優先度の高い安全・品質リスクに対しては見逃しを避ける側に基準を置き、工程側で誤警報を処理できる運用を合わせる。正常だけを学習する場合の限界や異常データの希少性を前提に、運用上のリスク管理も定義の一部だと考える。[7][8][1][5][2]

以上のように、正常・異常の定義は、監視パラメータの選定、条件別のベースライン、段階的しきい値、症状—故障対応表、しきい値の決定手順、更新の仕組み、そして説明可能性という柱で構成するのが健全である。国際規格や実務ガイドが示す一般指針に沿って、データ・運用・安全の三者が納得できる定義を築けば、その後の特徴量設計や学習モデルは安定して機能し、故障予知の信頼性が大きく高まる。[1][5][2] [1] https://www.jsme.or.jp/conference/joutai/doc/kaisai/20100210/sc5.pdf

[2] https://nvlpubs.nist.gov/nistpubs/ir/2014/NIST.IR.8012.pdf

[3] https://www.jstage.jst.go.jp/article/isciesci/65/4/65_119/_pdf/-char/ja

[4] https://jpn.nec.com/solution/dotdata/tips/failure-prediction/index.html

[5] https://article.murata.com/ja-jp/article/data-analysis-in-predictive-maintenance-2

[6] https://www.jsa.or.jp/datas/media/10000/md_2559.pdf

[7] https://www.fdma.go.jp/relocation/neuter/topics/fieldList4_16/pdf/r03/jisyuhoan_shiryo_03_02.pdf

[8] https://www.meti.go.jp/shingikai/sankoshin/hoan_shohi/koatsu_gas/pdf/017_s03_00.pdf

[9] https://arxiv.org/pdf/2101.11539.pdf

[10] https://skydisc.jp/4216/

[11] https://www.mlit.go.jp/jidosha/anzen/01asv/report06/file/guideline_8_kenchi.pdf

[12] https://www.jsme.or.jp/conference/joutai/doc/kaisai/20121012/motoi.pdf

[13] https://ieeexplore.ieee.org/document/8227036

[14] https://www.inrevium.com/pickup/data_analysis/

[15] https://key-s-c.co.jp/column/%E4%BA%88%E7%9F%A5%E4%BF%9D%E5%85%A8%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6

[16] https://www.sciencedirect.com/science/article/abs/pii/S0951832021006153

[17] https://www.global.toshiba/content/dam/toshiba/jp/technology/corporate/review/2023/05/f04.pdf

[18] https://www.city.kariya.lg.jp/_res/projects/default_project/_page_/001/003/885/22_03.pdf

[19] https://papers.phmsociety.org/index.php/phmap/article/download/3768/2235

[20] https://www.city.kobe.lg.jp/documents/15195/siryou44.pdf

※本ページは、AIの活用や研究に関連する原理・機器・デバイスについて学ぶために、個人的に整理・記述しているものです。内容には誤りや見落としが含まれている可能性もありますので、もしお気づきの点やご助言等ございましたら、ご連絡いただけますと幸いです。

※本ページの内容は、個人的な学習および情報整理を目的として提供しているものであり、その正確性、完全性、有用性等についていかなる保証も行いません。本ページの情報を利用したこと、または利用できなかったことによって発生した損害(直接的・間接的・特別・偶発的・結果的損害を含みますが、これらに限りません)について、当方は一切責任を負いません。ご利用は利用者ご自身の責任でお願いいたします。

おすすめの記事