“切火鍋”、“搞麻將撒”。在中國,有超1億人在工作和生活中,每天講著成都話。
近日,捷通華聲靈云AI研發團隊推出四川話語音識別技術,語音識別正確率實現行業領先。捷通華聲成都分公司負責人表示,靈云四川話語音識別技術將服務于車載、家居智能語音交互,司法審訊、政企會議智能語音轉寫等場景,為巴蜀地區大眾的生活和工作帶來便捷。
為了能更好、更精準地識別四川話,捷通華聲采集了大量真實四川話錄音數據,并對其進行語料標注和數據訓練,為四川話定制了專用語音識別模型。
在語音識別核心算法上,捷通華聲對建模單元粗粒度、模型訓練方法、解碼幀率進行創新優化,有效提升了語音識別引擎的執行效率和對口音、語速的適配能力,大幅提升了四川話語音識別的正確率。
四川話語音識別 讓大眾生活更便捷
智能語音交互技術已進入我們的生活,成為更便捷的人機交互方式。伴隨著此次四川話語音識別的推出,捷通華聲推出了系列四川話版智能語音產品。
靈云智能語音助理四川話版,讓川蜀大眾可以用四川話實現對智能電視、智能家居、智能機器人、智能可穿戴設備的語音控制;
靈云車載輸入法四川話版、靈云手機輸入法,可以讓四川地區車主、手機用戶用說四川話的方式快速進行文字輸入;
此外,捷通華聲四川話語音識別技術即將上線靈云平臺(AIcloud.com),讓開發者能快速開發出支持四川話識別的智能應用。
四川話語音識別 讓政企司法辦公更高效
在辦公方面,靈云智能語音識別技術已服務于政企會議、司法審訊等場景,用機器轉寫代替人工實現更高效的會議記錄。
在公檢法司法審訊場景,應用普通話、四川話語音識別技術,靈云智會系統將在識別審訊人普通話的同時,將被訊問人說的四川話進行識別,快速生成訊問記錄,加快辦案效率。
同樣,在政企會議場景,靈云智會系統可以分角色地將四川話進行識別,快速生成會議記錄;在醫療場景,可通過定制版的四川話醫療智能語音輸入法,讓醫生以說話的方式快速書寫電子病歷。
除了上面描述的16k語音識別技術,捷通華聲不久還將推出電話信道的8k四川話語音識別技術,以支持callcenter用的電話智能客服、智能外呼機器人、智能語音分析等方案產品。
捷通華聲作為國內最早從事智能語音技術研發的企業之一,目前,靈云語音識別技術已支持中文普通話、四川話、英語、粵語、維吾爾語、哈薩克語、藏語安多、藏語康巴、朝鮮語、蒙文、廣東陽江話等多種語言,并針對金融、電信、公檢法、會議、醫療等領域訓練了專用ASR模型,為行業客戶提供識別率更高的語音識別能力。
捷通華聲將通過成都分公司,攜手產業伙伴,為四川地區客戶提供更優質的本地化支持,讓靈云四川話語音識別技術服務更多的巴蜀大眾。【責任編輯/代天亮】
來源:IT時代網
IT時代網(關注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創文章版權所有,未經授權,轉載必究。
創客100創投基金成立于2015年,直通硅谷,專注于TMT領域早期項目投資。LP均來自政府、互聯網IT、傳媒知名企業和個人。創客100創投基金對IT、通信、互聯網、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創客100基金最顯著的特點。
小何
小何
小何
小何