原標題:直接開源,阿里達摩院公布下一代工業級語音識別模型
12 月 22 日消息:阿里巴巴達摩院今日發布了新一代語音識別模型 Paraformer,適用于語音輸入法、智能客服、車載導航、會議紀要等場景。
據介紹,這是業界首個應用落地的非自回歸端到端語音識別模型,在推理效率上最高可較傳統模型提升 10 倍,且識別準確率在多個權威數據集上名列第一。目前,該模型于魔搭社區面向全社會開源。
數據顯示,配合 GPU 推理,不同版本的 Paraformer 可將推理效率提升 5-10 倍。同時,Paraformer 使用了 6 倍下采樣的低幀率建模方案,可將計算量大幅降低,支持大模型的高效推理。
IT之家了解到,阿里達摩院方面表示,Paraformer 是阿里巴巴研發的下一代“殺手锏”級別的語音識別基礎模型,未來將廣泛應用于會議紀要產品“聽悟”、釘釘語音轉文字、高德導航等場景。
來源:IT之家
IT時代網(關注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創文章版權所有,未經授權,轉載必究。
創客100創投基金成立于2015年,直通硅谷,專注于TMT領域早期項目投資。LP均來自政府、互聯網IT、傳媒知名企業和個人。創客100創投基金對IT、通信、互聯網、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創客100基金最顯著的特點。
小何
小何
小何
小何