語音記錄,是記者、編輯、作家等文字工作者們常用的記錄方式。但語音并不方便后期的整理、分享,聽語音記錄的過程耗時耗力,影響信息的溝通。AI時代,人工智能技術(shù)與產(chǎn)品正不斷應(yīng)用到人們身邊,針對語音方面的技術(shù)尤其讓人驚艷。
捷通華聲利用國內(nèi)領(lǐng)先的靈云語音識別、語音合成技術(shù)打造出的AI辦公神器——靈云語音云(speech.aicloud.com),可為廣大企業(yè)及個人提供專業(yè)級語音識別、語音合成云服務(wù)。語音云的靈云樂識功能,能將會議、訪談等音頻直接轉(zhuǎn)換成文字稿件,并可在線轉(zhuǎn)寫編輯,可幫助記者、秘書、學生等快速將錄音整理成文字,分分鐘輕松完成采訪稿件、會議紀要、授課演講等。
為達到更好地轉(zhuǎn)寫效果,捷通華聲將最新推出的全新一代靈云語音識別技術(shù)應(yīng)用到語音云中,識別率實現(xiàn)跨越式提升。同時加入了更多應(yīng)用場景的語言模型庫,讓靈云語音云的識別準確率面對不同行業(yè)、不同領(lǐng)域的錄音都能保持超高水準,1小時的音頻幾分鐘即可轉(zhuǎn)寫完成。
為了讓更多人能夠享受到人工智能為工作、生活帶來的方便與快捷,現(xiàn)語音云服務(wù)靈云樂識(語音轉(zhuǎn)文字)、靈云樂說(語音合成)全部免費使用,且不限時、不限量,實現(xiàn)了真正意義上的免費語音云服務(wù)。
最新語音識別技術(shù) 轉(zhuǎn)寫更準更高效
捷通華聲作為國內(nèi)最早從事中文智能語音技術(shù)研究與應(yīng)用的高新技術(shù)企業(yè),擁有行業(yè)頂尖的靈云語音識別技術(shù)。新升級的靈云語音識別技術(shù)在CTC算法的基礎(chǔ)上,對建模單元粗粒度、模型訓練方法、解碼幀率進行創(chuàng)新優(yōu)化,有效提升了識別引擎的執(zhí)行效率、魯棒性,增強了口音、語速適配能力,大幅提升了多人對講、遠場講話等場景中的語音識別率,從而讓語音云轉(zhuǎn)寫更精準、速度更快。
#FormatImgID_2#
同時,為了保證專業(yè)領(lǐng)域的識別率,靈云語音云擁有新聞媒體、會議辦公、情感寫作、IT科技、影視娛樂、醫(yī)療保險、法院檢務(wù)等多種場景的語音識別模型,對不同領(lǐng)域的音頻轉(zhuǎn)寫進行特殊的模型訓練,大大幅提升了轉(zhuǎn)寫效果,幫助各行各業(yè)的用戶實現(xiàn)高效記錄和信息輸入。
在線轉(zhuǎn)寫編輯 邊聽邊改更高效
語音轉(zhuǎn)寫為文字后,為更好地提高文字整理效率,語音云還擁有在線分音頻節(jié)點編輯功能,用戶可以點擊任意需編輯的文字,系統(tǒng)會定位到該處文字的音頻節(jié)點,然后邊聽該段音頻邊即時修改文字,哪里文字轉(zhuǎn)寫不準,可以隨時點擊定位到相應(yīng)錄音上進行修改。
一般一段一小時的采訪錄音需要花兩三個小時才能整理完,而有了這個強大功能,通過邊聽邊校對,一小時的錄音聽完也就整理完了。并且,完全避免了整理錄音時聽著錄音手動按下暫停,在word上敲打文字后再回來點擊繼續(xù)播放的復(fù)雜操作。
自動過濾語氣詞:不少用戶上傳的采訪音頻中,被采訪者在說話時會存在部分語氣詞,如嗯、啊、額之類,這些語氣詞的轉(zhuǎn)寫可以說毫無用處也影響后續(xù)編輯。新版語音云可在音頻進行轉(zhuǎn)寫處理時,自動過濾掉這些語氣詞,從而讓轉(zhuǎn)寫結(jié)果更整潔、清晰、有重點,提升后續(xù)文字整理效率。
自助分段功能:新版靈云樂識增加了自動分段,可以實現(xiàn)對音頻轉(zhuǎn)寫后的文字結(jié)果實現(xiàn)自動分段功能,從而為用戶呈現(xiàn)出更好的轉(zhuǎn)寫視覺效果,方便后續(xù)編輯整理。
如何使用?
用戶可直接輸入網(wǎng)址:speech.aicloud.com即可進入語音云網(wǎng)站,另外也可以登錄靈云平臺(www.aicloud.com)點擊語音云服務(wù)按鈕進入。
完成注冊流程之后,即可免費使用語音云服務(wù)。在網(wǎng)站上點擊上傳音頻,通過選取相應(yīng)的語音識別模型領(lǐng)域,并選擇文件進行上傳,目前支持mp3、wav、m4a、spx、opus、amr的音頻格式。
點擊“創(chuàng)建任務(wù)”后,只需喝杯咖啡等待幾分鐘,幾個小時的采訪稿整理重任就這樣完成了。
靈云樂說 語音合成便捷高效
除了長錄音轉(zhuǎn)文字,語音云還有一項語音合成功能——靈云樂說。該功能可為用戶提供便捷高效的免費語音合成服務(wù):將想要合成的文字直接粘貼或?qū)氲骄W(wǎng)站上,即可實時合成出優(yōu)美動聽、媲美人聲的聲音。
針對不同用戶的需求,靈云樂說有幾十種不同音色音庫可自由選擇,并提供十幾種語言以便捷用戶。同時,可在合成的聲音中加入背景音樂,并能通過在線調(diào)節(jié)音量、語速、語調(diào),讓試聽效果達到最優(yōu)。
一直以來,捷通華聲始終堅持自主研發(fā)AI技術(shù)及產(chǎn)品,并致力于將像“靈云語音云”這樣的先進人工智能技術(shù)與產(chǎn)品落地應(yīng)用到實處,從而讓更多人享受到人工智能帶來的方便與快捷,歡迎大家來免費體驗。【責任編輯/徐天來】
來源:IT時代網(wǎng)
IT時代網(wǎng)(關(guān)注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創(chuàng)文章版權(quán)所有,未經(jīng)授權(quán),轉(zhuǎn)載必究。
創(chuàng)客100創(chuàng)投基金成立于2015年,直通硅谷,專注于TMT領(lǐng)域早期項目投資。LP均來自政府、互聯(lián)網(wǎng)IT、傳媒知名企業(yè)和個人。創(chuàng)客100創(chuàng)投基金對IT、通信、互聯(lián)網(wǎng)、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創(chuàng)客100基金最顯著的特點。
小何
小何
小何
來自: 【人物】滴滴創(chuàng)始人程維回顧與Uber競爭:中國互聯(lián)網(wǎng)從來沒有輸過--IT時代網(wǎng)
小何
來自: 少年頭條對壘中年騰訊:解局兩代互聯(lián)網(wǎng)公司商業(yè)之戰(zhàn)--IT時代網(wǎng)