來源 阿里語音AI 公眾號
2019年是阿里巴巴語音AI再一次突破性增長的一年。這一年,阿里語音AI致力於為客戶提供功能全面、開箱即用的智能語音服務,在功能和易用性上都取得了突破性的進展。本文將為大家盤點2019年度阿里語音AI原子能力產品的所有關鍵詞。
自學習平臺
1月份,公共雲提供自學習平臺免費試用功能,使得公共雲用戶均可以申請和體驗語音模型定製功能,在阿里多領域通用模型基礎上疊加自己專屬模型,自主自助地提升業務識別效果,進一步助力業務取得成功。
2月份,公共雲自學習平臺定製語言模型POP接口對外發布,提供基於阿里雲POP接口進行語言模型定製的能力,為用戶提供了與阿里雲其他雲產品風格統一、易於使用的API接口,幫助客戶打通業務系統與公共雲服務,提供更為高效、自動化的模型定製能力。
3月份,自學習平臺在公共雲和本地部署軟件上同步支持粵語和英語的模型定製能力,滿足客戶在方言本地化和國際化場景下更多語種的模型優化需求。
5月份,在本地部署版本已成功落地的基礎上,公共雲自學習平臺聲學模型定製內測版正式發佈,開始對共創客戶邀請制開放,提供界面化聲學模型自學習和效果評測相關功能。
產品性能持續性優化
2019年裡,我們對阿里語音AI的產品性能進行了持續升級,優化在線計算性能,提升整體系統服務能力,支持各種場景下客戶的海量併發請求。
3月,公共雲和本地部署軟件同時上線新版本char-word-piece-ctc 中英文模型,併發性能提升66%;
7月,快慢自調諧模型正式對外開放,對外提供更高準確率更低延遲的識別服務;
8月,公共雲提供了對文件轉寫服務的分組隔離和細粒度優先級處理,以更細微的控制角度滿足用戶的特定需求;
12月,快慢自調諧模型、通用基礎模型混部上線,大幅提升整體服務利用率,為客戶提供了更具彈性、更大負載能力的公共雲服務集群。
語音識別方言以及領域模型拓展
為了更好地滿足客戶在不同方言和領域上的需求,阿里語音AI持續不斷地建設和拓展多種方言和領域模型。
目前阿里語音AI已經支持湖南、湖北、河南、山東、山西、陝西、浙江、四川、粵語等15種重口音和方言的轉寫能力。
在業務領域方面,阿里語音AI目前已經支持了包含客服、金融、出行、演講、醫療、政務、半遠場、物流等在內的11個業務領域。
多領域識別模型
語音合成音庫
1月份,阿里巴巴智能語音在公共雲官網上線了語音合成聲音定製產品,向客戶提供深度定製專屬發音人音庫的服務,滿足客戶的個性化需求。
在此基礎上,到12月份,公共雲共新增17個精品TTS中英發音人,涵蓋客服、教育、銀行等多個領域,為客戶提供總計提供42個聲音和更多場景選擇。這些精品發音人的音質呈現,遠超過了市場競品的主流發音人,一經推出便迅速獲得了用戶的認可。這些發音人也可以在本地部署軟件中進行使用。
42個語音合成音色
語音新能力拓展
7月,口語評測公共雲內測上線,向教育行業客戶提供英語口語評測能力。
8月,聲紋識別、語種識別、性別識別開放給種子用戶試用。
12月,對話場景下的,實時語種性別功能驗證通過,為客戶提供了新的交互能力。
在持續提升語音識別和有語音合成功能和體驗之外,阿里語音AI也開拓了一些新的語音能力,以邀請制的形式對客戶開放,滿足用戶在更豐富的應用場景下使用的需求。
語音認證體系
8月,阿里雲大學智能語音專業認證上線,智能語音培訓體系及生態建設進入新階段:阿里雲大學智能語音專業認證,為合作伙伴、終端客戶提供了一個標準的系列課程,讓用戶能夠從零開始,一步一步從瞭解到熟悉,從感知到使用阿里巴巴智能語音的產品和服務。
同樣語音認證體系也提供了一個機會使得終端用戶可以實現部分崗位工作的轉型,例如從普通客服向產品運營、人工智能訓練師轉型升級。
智能語音技術認證證書樣例