pyAudioAnalysis是一個開放的Python庫，提供了許多與音頻相關的功能，著重於特徵提取，分類，分段和可視化問題。

功能

pyAudioAnalysis是一個Python庫，涵蓋了廣泛的音頻分析任務。

通過pyAudioAnalysis您可以：

提取音頻特徵和表示形式（例如，mfccs, spectrogram, chromagram）
訓練，參數調整和評估音頻片段的分類器
分類未知聲音
檢測音頻事件並從長時間錄音中排除靜音期
執行監督性細分（聯合細分-分類）
執行無監督的分段（例如，說話者二值化）並提取音頻縮略圖
訓練和使用音頻迴歸模型（示例應用程序：情感識別）
應用降維以可視化音頻數據和內容相似性

實用功能

將Mp3批量轉換為Wav
函數使用提供的採樣率（第二個參數）和通道數（第三個參數）convertDirMP3ToWav(dirName, Fs, nC, useMp3TagsAsName = False) 將文件夾的所有MP3文件轉換dirName為WAV文件。如果將最後一個參數（useMp3TagsAsName）設置為True，則輸出的WAV文件將通過MP3標籤（歌手和歌曲名）命名，否則將使用MP3文件名（當然，擴展名為.wav）

命令行使用示例
python audioAnalysis.py dirMp3toWav -i MusicData/ -r 16000 -c 1

另外，convertFsDirWavToWav()可以使用函數將存儲在特定文件夾中的WAV列表轉換為另一個採樣率的相同信號的新列表（再次是WAV文件）。交流示例：

python audioAnalysis.py dirWavResample -i MusicData/ -r 8000 -c 1

新文件存儲在名為Fs_Nc的新文件夾下，例如Fs8000_NC1
pyAudioAnalysis - Theodoros Giannakopoulos

下載安裝

下載文件包： pyAudioAnalysis模塊下載
安裝依賴：pip install -r ./requirements.txt
使用pip安裝： pip install -e

音頻分類示例

pyAudioAnalysis提供了易於調用的包裝器來執行音頻分析任務。例如，給定存儲在文件夾（每個文件夾代表一個不同的類別）中的一組WAV文件，此代碼首先訓練一個音頻片段分類器，然後使用經過訓練的分類器對未知的音頻WAV文件進行分類：

aT.extract_features_and_train(["classifierData/music","classifierData/speech"], 1.0, 1.0, aT.shortTermWindow, aT.shortTermStep, "svm", "svmSMtemp", False)aT.file_classification("data/doremi.wav", "svmSMtemp","svm")```

pyAudioAnalysis-用於音頻特徵提取，分類，分段和應用的python庫

功能

實用功能

下載安裝

音頻分類示例

Leave a Reply Cancel reply