開發與維運

產品推薦 | 理想的語音大腦是什麼樣?來看看華鎮VB590標準核心板

日前,華鎮語音大腦VB590標準核心板已在OCC上線。該方案針對語音芯片行業應用場景的碎片化、推廣週期長,應用場景複雜,缺乏統一語音標準等痛點,推出語音大腦VB590標準核心板,可廣泛應用在智能家居,智能衛浴,智能照明,智能機電,智能玩具等場景領域。

方案介紹

VB590標準核心板,採用高靈敏度模擬麥克風錄音,利用穩態、動態噪音過濾算法,動態調整錄音音量,錄音降噪後通過語音增強,將高信噪比的語料數據送到識別引擎去做識別,保證了不同距離識別的高精準度和抗噪能力,適合遠距離或嘈雜環境下真實複雜場景下的語音識別、語音控制。系統無需WiFi、無需APP並識別靈敏,內置VB590AI語音識別芯片,用於極速語音操控能力,用戶可以通過語音實現和設備的交互控制,帶來簡單快捷的使用體驗。

針對離線語音識別客製化程度高的特點,VB590方案實現SDK完全開放,自定義語音識別指令集,開發者可以連接華鎮服務器訓練對應的語音模型。訓練方法簡便,通過文本編輯的方式,就可以實現包括喚醒詞在內的針對不同客戶的語音模型。

四大優勢讓家庭控制更加智能化

【語音識別AI算法】基於第二代TDNN-LFMMI模型,識別率較第一代DNN-HMM 模型有巨大優勢,提高6%以上。

【多語種聲學模型】具備中文普通話、北美英語、英式英語的識別能力,能夠覆蓋絕大多數帶方言的普通話識別場景。中文模型包括了近2萬小時,英文模型包括了近1萬小時。

【前端聲學處理算法】支持語音增強、語音降噪、實現單麥遠場識別。

【客製化服務】SDK完全開放,提供自定義識別指令集, 開發者可以連接華鎮服務器訓練對應的語音模型。

94C90BB1-3C04-4b9a-8E1B-949BCABC82CC.png

芯片方面

VB590採用了平頭哥高性能32位處理器XT804。芯片上運行語音識別算法、語音降噪算法、語音增強算法實現了遠場離線語音識別。芯片內置語音識別神經網絡計算所需要的DSP指令增強單元以及MCA算法硬件加速器,AI算法與芯片架構深度融合,算力和效能之間取得非常好的平衡。

VB590芯片內置集成了128KB SRAM、2MB FlASH、ADC、DAC,外圍BOM極其簡單。芯片支持中文、英文離線語音指令識別、遠場識別、強噪音下識別,完全是高性價比離線識別芯片同時還支持二次開發,開發者可以自定義語音識別指令,從研發到量產,提供全流程服務。

此款產品已在OCC上線,更多產品詳情可掃描下方二維碼查看。

C9576F8F-26C0-49b1-AF2E-EC652899C7F9.png

公司介紹

上海華鎮電子科技有限公司成立於2006年,擁有近百項專利及軟件著作權。是國家高新技術企業,軟件企業並連續多年獲得上海市雙創大賽獎項,華鎮擁有多項人工智能核心算法,如:聲學前端的麥克風陣列(SMA)、遠聲降噪(NS)、回聲抑制(AEC)、人工智能深度神經網絡語音識別(KWS、ASR)、聲紋識別(VPR)等核心算法,有著豐富的研究及項目落地的經驗。華鎮聚合核心算法能力推出全方位賦能百業的人工智能開放平臺——語音大腦VoiceBrain開放平臺,作為軟硬件全鏈條能力的企業,華鎮可以為客戶提供一站式Turnkey服務,讓我們的合作伙伴用最小的成本,簡單、便捷的用上AI系統。

來源:芯片開放社區 微信公眾號
原文鏈接:https://mp.weixin.qq.com/s?__biz=MzIxMDMxMDQxNA==&mid=2247484433&idx=1&sn=b9fdd9d0f53b25465208abd78a7eada1&chksm=9767c070a0104966df35cbe675d68a89fd0984d9677f8809ff81f43fae17d2ddbb6668aeec97&token=1131223069&lang=zh_CN

Leave a Reply

Your email address will not be published. Required fields are marked *