『音による故障予知の教科書たたき台:5.1 平均、最大、最小、標準偏差などの統計量』LLMと一緒に書いてみた—AIが導く研究メモ

5. 特徴量抽出  

5.1 平均、最大、最小、標準偏差などの統計量

データから「何が起きているか」を素早くつかむためには、まず数のまとまり(分布)を短く要約する指標を計算するのが近道になる。これらは基本統計量と呼ばれ、代表的な値(代表値)と散らばり(ばらつき)を表す値が中心となる。代表値には平均、中央値、最頻値、さらに範囲(最大−最小)や四分位範囲などがあり、散らばりには分散と標準偏差がある。平均は「全部足して数で割る」もっとも馴染みのある指標で、最大・最小はデータの端を教え、範囲は全体の広がりを素早く伝える。標準偏差は「どのくらい平均から散っているか」を元の単位で教える尺度で、分散の平方根として定義されるため、数の意味が直感に合いやすい。[1][2]

まず、これらを直感で押さえる。平均は全体の中心的な位置を1つの数で示すが、極端に大きい(または小さい)値が1個混ざるだけでも引っ張られやすい弱点がある。その弱点を補うのが中央値で、大小に並べたときの真ん中の値であり、外れ値に強い。最大・最小は「どこまで広がっているか」の端を示し、最大から最小を引いた範囲は、手早い広がり指標として現場でよく使われる。分散は平均からの差(偏差)を二乗して平均したもので、ばらつきが大きければ値も大きくなるが、単位が二乗になって直感的に読みにくいので、その平方根である標準偏差で表すのが一般的である。[2][1]

次に、故障予知での意味づけを具体化する。機械音や振動の窓ごとの平均は、回転数や負荷変化に伴うベースラインの上下を示す単純だが有用な手がかりになる。最大・最小や範囲は、突発的なピーク(衝撃)やトランジェントの有無を素早く示し、警報のトリガにできる。標準偏差やRMS(実効値)は、全体の揺れの強さを安定に要約し、正常運転に比べて増えていないかを監視するのに適している。実際、時間領域の統計特徴として平均、RMS、標準偏差、さらに歪度(左右の偏り)や尖度(尖り具合)を組み合わせて健康状態を識別する枠組みが、振動診断や予知保全の研究・事例で広く使われている。[3][4][5][6]

計算と解釈のポイントをいくつか挙げる。平均は短時間の窓で見れば平滑化指標として働き、センサのオフセットやドリフトがないかの確認にもなる。範囲は簡便だが、単一の外れ値に敏感なので、頻度の監視には四分位範囲(IQR)も併用すると頑健になる。標準偏差は「平均からの散らばり」を示すため、一定の負荷で運転しているときに急に値が増えるなら、周期的でない乱れやノイズの増大、部品の摩耗などを示唆しうる。また、正規分布に近いと仮定できる状況では、平均±標準偏差に約68%、平均±2標準偏差に約95%が入るという経験則が、逸脱の目安として役立つ。[5][6][2]

時間領域の統計量の組み合わせは、識別力を高める。例えば、RMSは全体エネルギーの把握に、最大値(ピーク)は衝撃性イベントに敏感、範囲はざっくりとピークの変化を捉え、標準偏差は揺れの均し具合に反応する。さらに歪度・尖度を足すと、分布の形(左右の偏りや尖り)まで反映でき、軸受の初期欠陥のような「たまに鋭いピークが立つ」現象に尖度が敏感に反応することが知られている。最新のレビューでも、故障診断の前処理で、平均・RMS・標準偏差・歪度・尖度といった時間領域統計を基本セットとして抽出し、分類や深層学習に渡すのが一般的だと整理されている。[4][7][8][9][3][5]

実装の手順を具体化する。録音や加速度の生信号を等長の窓(例:数百ミリ秒)に分割し、各窓で平均・最大・最小・範囲・RMS・標準偏差を計算して、行=窓、列=特徴の配列にまとめる。この配列は、そのまま学習器や監視のしきい値判定に使える。風力タービンの事例解説でも、平均、標準偏差、RMS、ピークtoピーク、波高率(ピーク/RMS)など、時間領域の15種程度をまず算出してから絞り込む手順が紹介されている。こうした「まず基本統計量で全体像を掴む→必要に応じ高次や周波数特徴を足す」という段階的設計は、現場での再現性と説明性の両立に役立つ。[6][9][5]

注意点も押さえておきたい。平均は外れ値に弱く、標準偏差は分布の形に影響されるため、外れ値が多い現場データでは、中央値や四分位範囲も合わせて点検すると誤解が減る。また、機器やロットごとに分布が変わる場合は、単純に全体で平均と標準偏差を求めず、条件別に統計量を持つほうが健全である。さらに、監視やしきい値設計では、正規化(例えば平均0・標準偏差1への変換)を使い、条件差をならして比較可能にすることも多い。最終的な故障判定は、時間領域の統計に周波数領域(スペクトルのピークや帯域エネルギー)を補完すると、原因の切り分けがしやすくなる。[10][11][9][1][2][5]

現場の読み方を要約すると、平均の上昇はベースラインの変化やオフセットの出現、最大・最小や範囲の拡大は突発イベントの増加、標準偏差やRMSの上昇は全体の揺れ・エネルギーの増加を示す。これに歪度・尖度を加えれば、「時々起きる鋭い衝撃」が統計的に可視化される。最初の導入としては、平均・最大・最小・範囲・標準偏差・RMSの6点を毎窓で記録し、正常時のレンジを基準としてトレンドを見るのが堅実である。その後、必要に応じて歪度・尖度や周波数側の特徴を足していけば、早期兆候を逃しにくい監視系になる。[7][8][3][4][5] [1] https://data-viz-lab.com/stats

[2] https://www.rosei.jp/readers/article/55306

[3] https://academic.oup.com/jcde/article/10/1/204/6880159

[4] https://www.mecs-press.org/ijigsp/ijigsp-v12-n3/IJIGSP-V12-N3-4.pdf

[5] https://www.matlabexpo.com/content/dam/mathworks/mathworks-dot-com/images/events/matlabexpo/jp/2018/c4-failure-prediction.pdf

[6] https://www.cc.kyushu-u.ac.jp/scp/doc/users/lecture/2018/matlab_handout2.pdf

[7] https://www.internationaljournalssrg.org/IJECE/2016/Volume3-Issue3/IJECE-V3I3P104.pdf

[8] https://towardsdatascience.com/understanding-predictive-maintenance-wave-data-feature-engineering-part-1-fd22b6a19323/

[9] https://mlsysbook.ai/contents/labs/shared/dsp_spectral_features_block/dsp_spectral_features_block.html

[10] https://qiita.com/htg_ns/items/bb1d41620b99c6a516aa

[11] https://lit.fpark.tmu.ac.jp/lit/contents/office2019/statistics/01/index.html

[12] https://bellcurve.jp/statistics/course/25217.html

[13] https://note.com/bunsekiya_tech/n/n005628fcd6eb

[14] https://www.heisei-u.ac.jp/ba/fukui/pdf/stattextA05.pdf

[15] https://www.jstage.jst.go.jp/article/jsmedsd/2022.32/0/2022.32_2407/_pdf/-char/ja

[16] https://uribo.github.io/tokupon_ds/summary_statistics.html

[17] https://www.youtube.com/watch?v=WcmBwp3-knc

[18] https://www.jstage.jst.go.jp/article/isciesci/65/4/65_119/_pdf/-char/ja

[19] http://jupyterbook.hnishi.com/data-analysis/basic_statistic_values.html

[20] http://www.kunitomo-lab.sakura.ne.jp/2021-3-3Open(S).pdf

※本ページは、AIの活用や研究に関連する原理・機器・デバイスについて学ぶために、個人的に整理・記述しているものです。内容には誤りや見落としが含まれている可能性もありますので、もしお気づきの点やご助言等ございましたら、ご連絡いただけますと幸いです。

※本ページの内容は、個人的な学習および情報整理を目的として提供しているものであり、その正確性、完全性、有用性等についていかなる保証も行いません。本ページの情報を利用したこと、または利用できなかったことによって発生した損害(直接的・間接的・特別・偶発的・結果的損害を含みますが、これらに限りません)について、当方は一切責任を負いません。ご利用は利用者ご自身の責任でお願いいたします。

おすすめの記事