research 『音による故障予知の教科書たたき台:4.11 特徴量抽出用配列への変換』LLMと一緒に書いてみた—AIが導く研究メモ 4. データ前処理 4.11 特徴量抽出用配列への変換 ここでは、録音した波形(時間に沿った数列)を、機械学習が扱いやすい「特徴量ベクトル(配列)」に変換する一連の流れを、理由と手順をセットで分かりやすくまとめる。目的は、長くてバラつきのある生データを、行=サンプル、列=説明変数という揃った表(配列、行列)にし、分類・... 2025年8月28日
research 『音による故障予知の教科書たたき台:4.10 波形やスペクトログラムの可視化』LLMと一緒に書いてみた—AIが導く研究メモ 4. データ前処理 4.10 波形やスペクトログラムの可視化 波形の可視化は、音や振動の「時間とともにどう変わるか」を直感的につかむ基本の作業で、横軸が時間、縦軸が振幅(大きさ)のグラフとして描くのが出発点である。時間軸を正しく作るには、サンプリング周波数Fsとサンプル数Nから、0秒からN/Fs秒まで等間隔の配列を用意... 2025年8月28日
research 『音による故障予知の教科書たたき台:4.9 クラス不均衡への対処』LLMと一緒に書いてみた—AIが導く研究メモ 4. データ前処理 4.9 クラス不均衡への対処 クラス不均衡とは、分類したいデータのうち「あるクラス(多数派)が圧倒的に多く、別のクラス(少数派)がとても少ない」状態を指す。たとえば、正常データがほとんどで異常データがごく少数しかない場合が典型で、このまま学習すると「いつも正常と答えるだけ」で高い正解率に見えてしまい... 2025年8月28日
research 『音による故障予知の教科書たたき台:4.8 データ拡張(ノイズ付加、ピッチシフト)』LLMと一緒に書いてみた—AIが導く研究メモ 4. データ前処理 4.8 データ拡張(ノイズ付加、ピッチシフト) データ拡張とは、手元の音データに意図的な変形を加えて“別の状況で録ったかのような”バリエーションを増やす方法である。 モデルは多様な条件を学ぶほど現場で頑健になるため、収集が難しいケース(雑音環境、話者や機械個体の違い、録音条件の差)を仮想的に作り出す... 2025年8月28日
research 『音による故障予知の教科書たたき台:4.7 ラベル付け方法』LLMと一緒に書いてみた—AIが導く研究メモ 4. データ前処理 4.7 ラベル付け方法 ラベル付けとは、集めたデータひとつひとつに「これは何か」「どんな状態か」という答え(タグ)を与える作業である。機械学習では、この答えが学習の“正解”になり、モデルがパターンを覚える道しるべになる。画像なら「猫/犬」、音なら「正常/異常」や「異音の種類」、テキストなら「肯定/否... 2025年8月28日
research 『音による故障予知の教科書たたき台:4.6 データのシャッフル』LLMと一緒に書いてみた—AIが導く研究メモ 4. データ前処理 4.6 データのシャッフル データのシャッフルとは、並んでいるデータの順番をランダムに入れ替える操作である。一見単純に見えるが、学習の公平さや評価の正確さを保つうえでとても重要な前処理で、特に「データの並びが偏っている」場合に威力を発揮する。並び順には収集順(時系列)、機器やラインごと(グループ)、... 2025年8月28日
research 『音による故障予知の教科書たたき台:4.5 欠損データ処理』LLMと一緒に書いてみた—AIが導く研究メモ 4. データ前処理 4.5 欠損データ処理 観測や記録の現場では、値が入っていない「穴」が必ずと言ってよいほど生じる。これを欠損データ(欠測値)と呼び、その扱い方次第で解析結果や学習モデルの精度・信頼性は大きく変わる。最初に押さえるべきは、欠損がどういう理由で起きているか(欠損メカニズム)と、どの程度・どんな項目に偏っ... 2025年8月28日
research 『音による故障予知の教科書たたき台:4.4 音量調整(増幅・減衰)』LLMと一緒に書いてみた—AIが導く研究メモ 4. データ前処理 4.4 音量調整(増幅・減衰) 音量調整は、録音した信号の「大きさ」を目的に合わせて上げ下げする基本操作である。ここでいう大きさは、波形の振幅そのもの(電圧やデジタル値)と、それを対数で表すdB(デシベル)の両方で扱うと整理しやすい。振幅を何倍にするかを「ゲイン」と呼び、ゲインをdBで表すときは電圧... 2025年8月28日