這個單元要來探討的主題是:如何應用【SM軟體】的「時頻分析」(Spectrogram analysis)模組,進行國家級警報的聲音特徵分析?
先前幾個單元,都在談國家級警報音的特徵與分析結果,首先參閱圖1,右下方的【SM軟體】之「時頻分析」介面,看起來已經是很完整的分析結果,已經可以觀察到這個國家級警報音的聲音特徵。其中,呈現了:
1. 𝒑(𝒕):「聲音壓力時間波形」(time waveform of
sound pressure)。
2. 𝑳𝒑(𝒕):「聲音壓力位準」(Sound pressure level, SPL)。
3. 𝑮𝒑𝒑(𝒇):「聲音自身功率頻譜」(Auto power sound spectrum),可簡稱「聲音頻譜」(sound spectrum)。
4. 𝑮𝒑𝒑(𝒕,𝒇):「時頻圖」(Spectrogram),英文也可稱為time-frequency plot。
這個單元就很實務的來看應用【SM軟體】,以其「時頻分析」(Spectrogram analysis)模組,進行國家級警報的聲音特徵分析的細節步驟流程。
探討分析步驟之前,先來看【4個What】心法,這是有順序的,引導的思考如下:
1. What to know? 想知道甚麼?對這樣的國家級警報聲音,想要知道甚麼?
2. What to get? 要得到甚麼?又,明確的想要得到甚麼呢?
3. What to do? 需要做甚麼?
那麼,又需要做些甚麼樣的分析,才能夠得到想要的東西呢?
4. What to show? 應該呈現甚麼?最後,做了聲音的特徵分析,應該要呈現出甚麼數據呢?
如圖1顯示的國家級警報音的聲音特徵分析結果,確實已經可以解讀出主要的資訊:
1. 𝒑(𝒕):由原始的時間波形,可以看出,長-短-短的間歇性的聲音特徵。
2. 𝑳𝒑(𝒕):由聲音總量隨時間的變化,也可觀察到長-短-短的間歇性的聲音特徵,以及最高音量約80dB。
3. 𝑮𝒑𝒑(𝒇):由聲音頻譜在1000Hz左右,有兩個峰值頻率,並且有倍數頻率的諧頻(harmonics)效應。
4. 𝑮𝒑𝒑(𝒕,𝒇):由時頻圖,可觀察到主要的高音量,在1000Hz左右的兩個峰值頻率。而,較高頻率的響應,則相對比較小。
要得到圖1的分析結果,其實做了很多事,這個單元,就來討論如何進行分析,主要步驟說明如下:
1. 取得【SM軟體】:或是等同【SM軟體】分析功能的工具程式。
2. 取得國家級警報聲音檔案:網路上找到的是MP3聲音檔案。
3. 將MP3音檔,轉為WAV音檔:主要是,配合【SM軟體】的輸入數據方式。轉為WAV音檔的設定:取樣頻率 = 44100 Hz。可選擇:雙聲道/單聲道,不過【SM軟體】只能分析單聲道的聲音。
4. 開啟【SM軟體】–時頻分析模組:需要載入WAV檔案,即可進行相關分析
5. 分析步驟:需要瞭解【SM軟體】的幾個分析功能,包括:(1) 「頻譜分析」(Spectral analysis),(2) 「自身功率頻譜分析」(Auto power spectrum analysis),(3) 「時頻圖分析」(Spectrogram analysis),(4) 「聲音壓力位準分析」(Sound pressure level (SPL) analysis)。
針對這個國家級警報音的WAV檔案之分析,具體步驟與流程,說明如下:
(1)
檢視原始WAV檔案的有效頻寬:觀察圖2左邊的原始音檔特徵分析,可知:取樣頻率=𝑭𝒔 = 44100 Hz,來自轉為WAV音檔的設定。因此,可分析的最高有效頻率=𝑭_𝑵𝒚𝒒
= 𝑭𝒔/𝟐=𝟐𝟐𝟎𝟓𝟎 Hz。原始WAV音檔,在大約𝟏𝟓𝟎𝟎𝟎 Hz以上,音量非常小,可能是原始音檔就是如此。因此,有效最高頻率=𝑭_𝑬𝒇𝒇≅𝟏𝟓𝟎𝟎𝟎 Hz。另外,由時間波形,也可確認時間波形區間=兩個循環=10秒。
(2)
檢視時間波形訊號 𝒑(𝒕):參閱圖2右邊的𝒑(𝒕)圖示,可瞭解原始WAV的時間波形特徵。其循環週期:長=2秒、短=1秒、短=1秒。每一個區間,間隔0.5秒。一個循環週期,共5秒。
(3)
檢視噪音總量𝑳𝒑 (𝒕):參閱圖2右邊的𝑳𝒑 (𝒕)圖示,可觀察隨時間的dB或dBA的噪音總量變化,因為是高頻率的聲音,兩者的量值相當,都是80 dB。同時,也間接佐證,時間波形的循環週期特徵。
(4)
檢視頻譜圖𝑮𝒑𝒑 (𝒇):參閱圖3的𝑮𝒑𝒑 (𝒇)圖示,顯示技巧,調整了頻率上限=5000 Hz,終止時間=10秒。觀察峰值頻率,主要的組成頻率是:852、960、2558、2880、4264、4800
Hz。有兩個主要基礎頻率(fundamental frequency),而且似乎都有倍數頻率的諧頻(harmonics)效應,實際上是1、3、5倍的關係。
(5)
檢視時頻圖𝑮𝒑𝒑 (𝒕,𝒇):參閱圖3的圖示,可看出頻率組成,隨時間之變化,在此案例,是穩定的聲音特徵。其中,852、960
Hz兩個頻率的音量,比其他高頻率的峰值較大,所以,主導的基音頻率就是852、960
Hz兩個頻率合成的音量。
總結一下這個單元的討論,如何應用【SM軟體】的「時頻分析」(Spectrogram analysis)模組,進行國家級警報的聲音特徵分析?重點摘錄如下:
1.
參閱圖1,右下方的【SM軟體】之「時頻分析」介面,看起來已經是很完整的分析結果。
2.
進行實務的聲音特徵分析之前,採用【4個What】心法思考重點的分析工作:(1) What to know?,(2) What to get?,(3) What to
do?,(4) What to
show?。
3.
參閱圖1,彙整了【SM軟體】的「時頻分析」(Spectrogram analysis)模組的應用步驟流程。分別參閱圖2、圖3,歸納了主要的5個分析步驟:(1) 檢視原始WAV檔案的有效頻寬,(2) 檢視時間波形訊號
𝒑(𝒕),(3) 檢視噪音總量𝑳𝒑 (𝒕),(4)
檢視頻譜圖𝑮𝒑𝒑 (𝒇),(5)
檢視時頻圖𝑮𝒑𝒑 (𝒕,𝒇)。
以上個人看法,請多指教!
王栢村
2025.04.01
![]() |
圖1、如何應用SM軟體時頻分析模組於國家級警報的聲音特徵分析? |
![]() |
圖2、應用SM分析國家級警報音過程(1/2) |
![]() |
圖3、應用SM分析國家級警報音過程(2/2) |