
5. 特徴量抽出
5.11 特徴量の組み合わせ設計
特徴量の組み合わせ設計とは、すでに用意した複数の特徴量を、意味のある形で組み合わせて新しい特徴を作り、モデルのわかりやすさや予測力、頑健性を高める工夫である。たとえば、時間領域のRMSと高周波のバンドエネルギーを比率にする、ピーク数と短時間エネルギーを掛け合わせて「衝撃の強さ×頻度」を表す、といった合成が該当する。組み合わせは強力だが、やみくもに増やすと過学習や解釈困難を招くため、段階的に設計して検証で確かめるのが要点になる。[1][2][3][4]
まず、基本方針を整理する。- 目的から逆算して設計する。何を区別したいか(例:正常と特定の異常)、どの誤りを減らしたいか(見逃しか誤警報か)を先に決め、そのために必要な情報がどの特徴に宿るかを考える。- 直感的で単純な組み合わせを優先する。和・差・積・比、対数、正規化といった素朴な合成でも、信号処理の知見と結びつけると効果が高い。- 正規化とスケール合わせを徹底する。異なる単位や桁を混ぜると一方が支配的になるため、標準化や最小最大スケーリングで土俵をそろえる。- 増やし過ぎない。候補を広めに出しても、重要度評価や検証で間引き、モデルの複雑さと性能の釣り合いを取る。[3][4][5][6][7][1]
次に、具体的な組み合わせの型を挙げる。- 比(比率)型:高域バンドエネルギー/全エネルギー、側帯域合計/メインピーク、高周波RMS/低周波RMSなど。全体レベルが変動しても相対配分の変化を捉えやすく、環境差に頑健になりやすい。- 積(相互作用)型:ピーク数×短時間エネルギー、ゼロ交差率×バンドエネルギー、RMS×スペクトル重心など。二つの要因がそろったときだけ大きく反応する「掛け合わせ効果」を表現できる。- 差・傾き型:高域−低域エネルギー、スペクトル重心の時間差分、RMSの移動差分。増減や傾向変化を直接扱える。- 正規化合成:特徴/(平均+小定数)、Zスコアで標準化後に線形結合。スケールの違いを打ち消し、比較を安定させる。- 連結(早期融合):時間領域・周波数領域・時間周波数領域の特徴を横につなぎ、ひとつの長いベクトルにまとめる(例:RMS、ピーク、バンドエネルギー、MFCC)。- 遅延融合:モデルごとに特徴群を学習し、最後にスコアや確率を統合する(遅延融合)ことで、異種情報の補完関係を活かす。[8][4][9][10][11][5][12][3]
合成時の典型的なミスと対策も押さえる。- 同じ情報の重複:強相関の特徴を足しても実質情報が増えず、過学習の温床になる。相関チェックや重要度評価で間引く。- スケール不一致:単位や桁が揃わず一方が支配的になる。標準化・正規化を先に適用する。- 意味のない操作:ノイズに敏感な特徴同士の積・比は不安定になりやすい。平滑化や分母に小定数を加えるなど数値安定化を施す。- 作り過ぎ:膨大な派生で検証の負担が増える。段階的に導入し、効果の薄いものは早めに撤去する。[2][4][5][6][1][3]
次に、設計〜検証の手順を具体化する。1) 基本セットを準備:RMS、短時間エネルギー、ゼロ交差率、スペクトル重心、バンドエネルギー、ピーク情報など、単体で意味が明確な特徴を揃える。2) 直感に基づく候補を作る:比(高域/全体、側帯域/主ピーク)、積(粗さ×強さ)、差(高域−低域)、時間差分(トレンド検出)などの少数から始める。3) スケール合わせ:標準化や0–1正規化を適用し、学習データの統計で変換して検証・テストにも同じ変換を適用する(情報漏えい防止)。4) 重要度・相互作用のスクリーニング:ツリーモデルや疎な線形モデルで重要度を見て冗長な特徴を削る。必要に応じてペアの相互作用を自動生成し、上位のみ残す。5) 融合の比較:早期融合(連結)と遅延融合(スコア統合)を小さな実験で比較し、どちらが安定かを選ぶ。6) 本評価:層化分割や時系列分割で、F1やPR曲線、ROCなど目的に合う指標で性能とばらつきを確認する。[4][9][10][11][13][5][12][2][3]
融合(特徴のまとめ方)には二つの主流がある。- 早期融合(特徴連結):すべての特徴を一つのベクトルにまとめ、単一モデルで学習する。相関や補完関係をモデルが同時に学べるのが利点だが、スケーリングと次元増加への配慮が必要。- 遅延融合(スコア統合):特徴群ごとに別モデルを作り、最後にスコアを足す・重み付き平均するなどで統合する。モジュール性が高く、異種センサや別処理系を組み合わせやすい。どちらも一長一短であり、対象やデータ量、運用の制約で選ぶのが現実的である。[10][11][12]
相互作用(掛け合わせ)の発想は強力で、二つの特徴がそろったときだけリスクが跳ね上がるケースを表現できる。たとえば、「高域ノイズ(バンドエネルギー)×粗さ(ゼロ交差率)」が同時に高いときにだけ故障度が増す、といった形である。相互作用はペアワイズから始め、効果が確認できたら残す。多数の自動生成は便利だが、検証での間引きを必ず併用する。[9][5][3]
評価・運用でのベストプラクティスをまとめる。- まずは単純な特徴と組み合わせで土台を作り、伸び悩んだら次の候補を追加する(段階的投資)。- 指標はタスクに合わせる。希少な異常の検出ではPR曲線やF1を重視し、閾値調整を前提に比較する。- 再現性を確保する。前処理の統計、派生ルール、乱数種、選択された特徴の一覧を記録し、将来の差分検証に備える。- 過学習の監視。性能が局所的にしか向上しない派生は撤去し、汎化する派生だけ残す。[13][6][7][1][2]
最後に、故障予知で役立つ具体例を挙げる。- 高域比率:高域バンドエネルギー/総エネルギー。潤滑悪化や摩耗で高域が増える傾向を相対値で捉える。- 側帯域比:側帯域合計/メインピーク。変調由来の側帯域の発達を定量化する。- 粗さ×強さ:ゼロ交差率×短時間エネルギー(またはRMS)。高周波で強いイベントを強調する。- 重心の変化率:スペクトル重心の時間差分。高域化の進行を時間勾配で捉える。- 早期融合テンプレート:RMS、バンドエネルギー群、スペクトル重心、ピーク特徴、MFCC数個を連結し、標準化して単一モデルに入力。- 遅延融合テンプレート:時間領域モデル、周波数領域モデル、時間周波数領域モデルを別に学習し、確率の重み付き平均で統合。[11][5][12][8][3][9][10]
以上の設計原則(目的志向、単純優先、スケール統一、段階導入、融合比較、相互作用の抑制的採用)を守れば、特徴量の組み合わせは予測力と解釈性の両立に大きく寄与する。合成は“足し算”ではなく“意味の再編”である。物理直感とデータ駆動の検証を往復しながら、少数精鋭の組み合わせへ磨き込むことが、故障予知の実務で最も確かな近道である。[5][2][4] [1] https://qiita.com/GushiSnow/items/4f2e54510d6c682e02be
[2] https://developers.google.com/machine-learning/guides/rules-of-ml?hl=ja [3] https://talent500.com/blog/feature-engineering-creating-new-features-to-enhance-model-performance/ [4] https://jp.dotdata.com/blog/machine-learning-feature-engineering/ [5] https://machinelearningmastery.com/tips-for-effective-feature-engineering-in-machine-learning/ [6] https://wonderfulfxlife.com/catboost_features/ [7] https://www.featureform.com/post/feature-engineering-guide [8] https://book.st-hakky.com/data-science/what-are-features-in-demand-forecasting-ai-usage [9] https://towardsdatascience.com/feature-interactions-524815abec81/ [10] https://www.sciencedirect.com/topics/computer-science/feature-fusion [11] https://www.sciencedirect.com/science/article/abs/pii/S1566253523000520 [12] https://ieeexplore.ieee.org/document/10185035/ [13] https://zenn.dev/pn8128/articles/a7ccd96a433d16 [14] https://datachemeng.com/best_practice_in_data_analysis_machine_learning/ [15] https://note.com/hayato_kumemura/n/n0290ff297085 [16] https://ieeexplore.ieee.org/document/11014574/ [17] https://nishoko.com/%E3%83%8D%E3%83%83%E3%83%88%E3%83%AF%E3%83%BC%E3%82%AF/ai/%E7%89%B9%E5%BE%B4%E9%87%8F%E3%82%A8%E3%83%B3%E3%82%B8%E3%83%8B%E3%82%A2%E3%83%AA%E3%83%B3%E3%82%B0%E3%82%92%E3%83%9E%E3%82%B9%E3%82%BF%E3%83%BC%E3%81%99%E3%82%8B%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92/ [18] https://christophm.github.io/interpretable-ml-book/interaction.html[19] https://datachemeng.com/summarydataanalysis/※本ページは、AIの活用や研究に関連する原理・機器・デバイスについて学ぶために、個人的に整理・記述しているものです。内容には誤りや見落としが含まれている可能性もありますので、もしお気づきの点やご助言等ございましたら、ご連絡いただけますと幸いです。
※本ページの内容は、個人的な学習および情報整理を目的として提供しているものであり、その正確性、完全性、有用性等についていかなる保証も行いません。本ページの情報を利用したこと、または利用できなかったことによって発生した損害(直接的・間接的・特別・偶発的・結果的損害を含みますが、これらに限りません)について、当方は一切責任を負いません。ご利用は利用者ご自身の責任でお願いいたします。