<pre id="co8k0"><cite id="co8k0"></cite></pre><strike id="co8k0"></strike>
  • <acronym id="co8k0"><cite id="co8k0"></cite></acronym>
  • <nav id="co8k0"></nav>
    <input id="co8k0"><em id="co8k0"></em></input>
  • vivo AI算法中心:信息處理更高效,AI打造1001個便利

    11月8日,以“MORE,近你所想”為主題的2022 vivo開發者大會正式開幕,在次日舉辦的人工智能專場上,vivo AI團隊通過計算攝影、文檔圖像處理、語音技術、語義技術、機器翻譯、計算加速平臺、開放平臺AI專區等多方面具體案例,介紹了vivo近兩年來在人工智能領域所做的探索和實踐。

    在人工智能領域,vivo從用戶需求出發,不斷創新,致力于實現“1001個便利”。生活中,當你沉醉于一首動聽的音樂卻苦于不知道歌曲名稱時,AI可以幫你聽歌識曲;當你看英文視頻卻發現聽不懂時,AI可以給你提供字幕翻譯;當你想拍出好的照片卻看不懂相機的一堆參數時,AI計算攝影可以自動幫你把場景色彩還原的更準確,把食物的色澤拍得更鮮艷;工作中,當你需要掃描文件并進行修改發送時,AI可以幫你去除燈光下的手指陰影和屏幕上的摩爾紋,并可以將拍下來的圖片轉化成可編輯的電子文檔,讓你信息處理更高效;我們希望持續通過AI能力為用戶帶來無處不在的驚喜和激動人心的體驗。

    vivo AI算法中心高級總監 陳曉昕演講-1001個便利

    AI計算攝影,為用戶帶來自然色彩極致還原的驚喜

    在2020年底,vivo就與蔡司開啟了全球影像戰略合作。今年,vivo聯合蔡司團隊進一步探討和制定忠于人眼所見的自然色彩理念。 在今年發布的X80系列上,vivo推出了全新升級的蔡司自然色彩2.0.可以更準確的還原真實自然色彩,提升大面積深色和淺色等困難場景下曝光和白平衡準確率。蔡司自然色彩2.0底層使用了最新的兩項AI計算攝影技術突破:智能白加黑減和智能白平衡技術。

    vivo AI視覺應用組總監 冉龍金演講——AI計算攝影

    通過智能白加黑減技術,vivo在行業內首次解決了大面積深色和淺色場景下曝光不準確的問題。在拍服飾、寵物、雪景等困難場景下,曝光準確率相對于原有方法,提升了16%。

    而智能白平衡技術則主要解決拍美食、拍花、拍寵物等場景下偏色的問題。vivo根據亞洲人色彩恒常性的視覺特點,以及拍攝場景的特點構建了豐富的色彩數據集。再通過人工智能模型實際學習人眼看到的色彩,從而獲得更準確的白平衡參數。相對于原有方法,在拍美食、拍花、拍寵物等場景下,色彩精準度提升13%。

    vivo AI視覺理解組總監 文亞飛演講——琥珀掃描

    AI語音技術,架起情感交流的橋梁

    除了在視覺方面為用戶打造的便利,vivo還通過AI語音技術,進一步幫助用戶解放雙手和雙眼。

    vivo的AI語音技術體現在兩方面,首先是語音合成技術。基于自研的個性化語音合成系統,vivo持續地研發出了豐富多元的合成聲音,不但提供了清新、甜美、穩重等多種不同的音色,同時還支持對話、新聞、小說等不同場景下的朗讀風格,實現了音色、風格以及情感三種元素的自由組合。經歷多年技術的沉淀,vivo發表了頂會論文8篇,獲取兩項國際賽事第一名,同時Jovi語音助手和屏幕朗讀的語音合成技術還獲得了通信院和泰爾實驗室認證。

    vivo AI語音中心總監 陳彬彬演講——AI語音技術

    機器翻譯,讓溝通沒有障礙

    面對日益豐富的國際交流和文化碰撞,vivo通過科技創新助力用戶突破語言障礙,讓用戶生活更加高效便利。AI雙語字幕讓愛看電影愛追劇的朋友隨心所欲地看生肉,還支持中外雙語字幕對照展示,學生群體上網課也不用愁。另外,vivo手機內置的系統級應用翻譯機支持二十多個主流語種的流暢互譯,同時vivo還推出了Jovi輸入法快捷翻譯、識屏翻譯、拍照翻譯等多項功能,幫助用戶克服語言溝通的障礙。

    vivo 針對翻譯的重點人群、高頻場景、便捷入口均設計了產品方案,助力高效解決翻譯需求。” 來自vivo機器翻譯團隊的李方圓在演講中闡述。

    vivo AI機器翻譯組高級經理 李方圓演講

    vivo在針對文本、圖片、聲音三種內容形態均研發了算法能力。在圖片翻譯技術上,攻克落合并和圖片文字涂抹兩大技術難點,提升了圖片翻譯的質量和排版的美觀度。在語音翻譯技術方面,vivo聚焦優化流式場景下的語音翻譯效果,持續優化模型對ASR噪音的魯棒性,在翻譯質量、穩定性、翻譯延時三者之間取得平衡。

    經歷2年多的沉淀,vivo的機器翻譯團隊在今年的全國機器翻譯大賽上斬獲漢英翻譯、中日英多語言翻譯2項冠軍,并且還在英漢、藏漢、中泰、泰中4個賽道上獲得亞軍。

    Jovi輸入法Pro,最大限度保護用戶隱私

    面對由輸入法引發的用戶隱私泄露問題,vivo首次推出了完全自研的Jovi輸入法Pro,以實際行動筑牢數據安全、隱私保護與守法合規的企業紅線。

    vivo AI算法中心高級總監 陳曉昕演講——Jovi輸入法Pro

    Jovi輸入法Pro提供了本地模式,輸入法可以實現完全本地運行,無需用戶進行聯網授權,保證了用戶的個人信息和數據只保存在本地。為了實現Jovi輸入法的本地模式,vivo對拼音、語音、手寫三大輸入法內核進行了全面優化升級,通過知識蒸餾、模型壓縮、計算加速等手段實現了算法在多個維度的均衡,提供安全、高效的輸入體驗。

    Jovi語音助手,化身便捷、溫暖的“貼心小管家”

    作為vivo手機的智能生活助理,Jovi語音助手受到了越來越多的用戶喜愛。經過四年多的優化提升,Jovi語音助手在工信部組織的第一期人工智能產業創新重點任務揭榜工作中,在“智能語音交互系統”領域拔得頭籌,榮譽揭榜。“在手機端日活已經超過1000萬,每個月小v會和用戶產生18億次對話,回答2億個問題。” 杜乃喬在演講中說。

    vivo AI應用中心高級總監 杜乃喬演講——Jovi語音助手

    自推出以來,vivo一直圍繞著便利的技能、豐富的知識、貼心的閑聊三個方向來提升Jovi語音助手。據悉,目前Jovi語音助手已經支持超過100個場景垂類,超過600種用戶請求意圖,很好地滿足用戶在快捷操作、信息獲取、情感陪伴方面的需求。

    VCAP異構計算加速,打造極致AI應用體驗

    基于應用場景,算法,硬件的發展,AI業務端側化面臨多元化的挑戰,為了應對AI業務多元化挑戰,vivo建設了VCAP異構計算加速平臺,為開發者提供全鏈路AI算法端側化解決方案。VCAP持續追求全能力、跨平臺、高性能的目標,全面支持視覺、語音、自然語言處理、推薦各領域業務落地。目前,VCAP異構計算加速平臺沉淀7種XPU器件加速能力,支持超過60種算法、80種算子。基于VCAP平臺能力,vivo支持典型影像、視頻、語音場景業務落地,為用戶打造更為極致的AI應用體驗。

    “我們希望借助于VCAP開放能力,能攜手更多行業開發者為用戶打造更多的AI應用產品!” 來自vivo AI團隊的魯晶說道。

    vivo AI系統平臺組高級經理 魯晶演講

    攜手開發者,為用戶打造1001個便利

    今年vivo開發平臺 AI專區在算法、數據、算力強大的技術底座上,開放了云端兩個方向的能力,包含Jovi服務平臺、AI算法平臺、內容理解平臺、Jovikit、VCAP計算加速平臺。

    以Jovi服務平臺為例,vivo通過AI賦能、服務找人的形式進行智能精準的投放,投放后,會有億級流量場景進行分發。對開發者來說,用更低的流量成本就可以獲得更高的曝光機會和更優的轉化質量。在用戶層面,用戶獲取服務成本低,免安裝,有更多入口直達多樣服務。

    vivo AI平臺產品組高級經理 劉詩韻演講

    進入開發者平臺-AI專區。注冊成為開發者后,只需簡單幾個步驟就能完成接入。通過這些開放的能力,攜手開發者,為用戶在多種場景方方面面打造1001便利。

    人文之悅一直是 vivo的品牌主張,在關注普通用戶的同時,vivo對于特殊用戶群體的關懷也未曾缺位。據介紹,在今年召開的第四屆科技無障礙發展大會上,vivo榮獲了“2022可及信息無障礙優秀案例”,成為唯一的獲獎手機品牌。

    vivo AI算法中心高級總監 陳曉昕演講——關注特殊用戶群體

    2017年,vivo開始組建AI全球研究院,旨在幫助所有消費者享受科技帶來的美好生活。截至目前,在vivo手機的100多個系統模塊中,目前已經有超過60%的模塊中搭載了AI能力,在用戶看得見和看不見的地方發揮著作用,提供便利,創造驚喜。

    vivo希望依托OriginOS能力,以用戶使用手機的重要場景為載體,通過AI技術與場景的深度結合,致力于打造1001個便利,為用戶提供無處不在的驚喜與方便。

    來源:中國財富網

    IT時代網(關注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創文章版權所有,未經授權,轉載必究。
    創客100創投基金成立于2015年,直通硅谷,專注于TMT領域早期項目投資。LP均來自政府、互聯網IT、傳媒知名企業和個人。創客100創投基金對IT、通信、互聯網、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創客100基金最顯著的特點。

    相關文章
    vivo AI算法中心:信息處理更高效,AI打造1001個便利
    Meta人工智能「ESMFold」可預測微生物6億多種蛋白質結構
    腦機接口新產品亮相,獨角獸BrainCo強腦科技用科技改變生活
    共話AI未來 | 探討機器學習發展現狀及人工智能未來趨勢

    精彩評論