日前,華鎮語音大腦VB590標準核心板已在OCC上線。該方案針對語音芯片行業應用場景的碎片化、推廣週期長,應用場景複雜,缺乏統一語音標準等痛點,推出語音大腦VB590標準核心板,可廣泛應用在智能家居,智能衛浴,智能照明,智能機電,智能玩具等場景領域。
方案介紹
VB590標準核心板,採用高靈敏度模擬麥克風錄音,利用穩態、動態噪音過濾算法,動態調整錄音音量,錄音降噪後通過語音增強,將高信噪比的語料數據送到識別引擎去做識別,保證了不同距離識別的高精準度和抗噪能力,適合遠距離或嘈雜環境下真實複雜場景下的語音識別、語音控制。系統無需WiFi、無需APP並識別靈敏,內置VB590AI語音識別芯片,用於極速語音操控能力,用戶可以通過語音實現和設備的交互控制,帶來簡單快捷的使用體驗。
針對離線語音識別客製化程度高的特點,VB590方案實現SDK完全開放,自定義語音識別指令集,開發者可以連接華鎮服務器訓練對應的語音模型。訓練方法簡便,通過文本編輯的方式,就可以實現包括喚醒詞在內的針對不同客戶的語音模型。
四大優勢讓家庭控制更加智能化
【語音識別AI算法】基於第二代TDNN-LFMMI模型,識別率較第一代DNN-HMM 模型有巨大優勢,提高6%以上。
【多語種聲學模型】具備中文普通話、北美英語、英式英語的識別能力,能夠覆蓋絕大多數帶方言的普通話識別場景。中文模型包括了近2萬小時,英文模型包括了近1萬小時。
【前端聲學處理算法】支持語音增強、語音降噪、實現單麥遠場識別。
【客製化服務】SDK完全開放,提供自定義識別指令集, 開發者可以連接華鎮服務器訓練對應的語音模型。
芯片方面
VB590採用了平頭哥高性能32位處理器XT804。芯片上運行語音識別算法、語音降噪算法、語音增強算法實現了遠場離線語音識別。芯片內置語音識別神經網絡計算所需要的DSP指令增強單元以及MCA算法硬件加速器,AI算法與芯片架構深度融合,算力和效能之間取得非常好的平衡。
VB590芯片內置集成了128KB SRAM、2MB FlASH、ADC、DAC,外圍BOM極其簡單。芯片支持中文、英文離線語音指令識別、遠場識別、強噪音下識別,完全是高性價比離線識別芯片同時還支持二次開發,開發者可以自定義語音識別指令,從研發到量產,提供全流程服務。
此款產品已在OCC上線,更多產品詳情可掃描下方二維碼查看。
公司介紹
上海華鎮電子科技有限公司成立於2006年,擁有近百項專利及軟件著作權。是國家高新技術企業,軟件企業並連續多年獲得上海市雙創大賽獎項,華鎮擁有多項人工智能核心算法,如:聲學前端的麥克風陣列(SMA)、遠聲降噪(NS)、回聲抑制(AEC)、人工智能深度神經網絡語音識別(KWS、ASR)、聲紋識別(VPR)等核心算法,有著豐富的研究及項目落地的經驗。華鎮聚合核心算法能力推出全方位賦能百業的人工智能開放平臺——語音大腦VoiceBrain開放平臺,作為軟硬件全鏈條能力的企業,華鎮可以為客戶提供一站式Turnkey服務,讓我們的合作伙伴用最小的成本,簡單、便捷的用上AI系統。