pyAudioAnalysis是一個開放的Python庫,提供了許多與音頻相關的功能,著重於特徵提取,分類,分段和可視化問題。
功能
pyAudioAnalysis是一個Python庫,涵蓋了廣泛的音頻分析任務。
通過pyAudioAnalysis您可以:
- 提取音頻特徵和表示形式(例如,mfccs, spectrogram, chromagram)
- 訓練,參數調整和評估音頻片段的分類器
- 分類未知聲音
- 檢測音頻事件並從長時間錄音中排除靜音期
- 執行監督性細分(聯合細分-分類)
- 執行無監督的分段(例如,說話者二值化)並提取音頻縮略圖
- 訓練和使用音頻迴歸模型(示例應用程序:情感識別)
- 應用降維以可視化音頻數據和內容相似性
實用功能
將Mp3批量轉換為Wav
函數使用提供的採樣率(第二個參數)和通道數(第三個參數)convertDirMP3ToWav(dirName, Fs, nC, useMp3TagsAsName = False) 將文件夾的所有MP3文件轉換dirName為WAV文件。如果將最後一個參數(useMp3TagsAsName)設置為True,則輸出的WAV文件將通過MP3標籤(歌手和歌曲名)命名,否則將使用MP3文件名(當然,擴展名為.wav)
命令行使用示例python audioAnalysis.py dirMp3toWav -i MusicData/ -r 16000 -c 1
另外,convertFsDirWavToWav()可以使用函數將存儲在特定文件夾中的WAV列表轉換為另一個採樣率的相同信號的新列表(再次是WAV文件)。交流示例:
python audioAnalysis.py dirWavResample -i MusicData/ -r 8000 -c 1
新文件存儲在名為Fs_Nc的新文件夾下,例如Fs8000_NC1pyAudioAnalysis - Theodoros Giannakopoulos
下載安裝
下載文件包: pyAudioAnalysis模塊下載
安裝依賴:pip install -r ./requirements.txt
使用pip安裝: pip install -e
音頻分類示例
pyAudioAnalysis提供了易於調用的包裝器來執行音頻分析任務。例如,給定存儲在文件夾(每個文件夾代表一個不同的類別)中的一組WAV文件,此代碼首先訓練一個音頻片段分類器,然後使用經過訓練的分類器對未知的音頻WAV文件進行分類:
aT.extract_features_and_train(["classifierData/music","classifierData/speech"], 1.0, 1.0, aT.shortTermWindow, aT.shortTermStep, "svm", "svmSMtemp", False)aT.file_classification("data/doremi.wav", "svmSMtemp","svm")```