<pre id="co8k0"><cite id="co8k0"></cite></pre><strike id="co8k0"></strike>
  • <acronym id="co8k0"><cite id="co8k0"></cite></acronym>
  • <nav id="co8k0"></nav>
    <input id="co8k0"><em id="co8k0"></em></input>
  • 騰訊李松南:8K、沉浸式和AI是視頻技術的3個關鍵詞

    【IT時代網廣州報道】9月11日,2020騰訊數字生態大會視頻通信云專場拉開帷幕。會上,騰訊多媒體實驗室總監李松南發表了以《多媒體視頻技術的前沿展望》為主題的演講。他認為,8K、沉浸式和AI是視頻技術領域的三大關鍵詞,同時也代表了視頻技術的發展方向,騰訊多媒體實驗室將持續致力于相關技術的研究和標準建設,為騰訊云以及外部企業提供優質的視頻技術服務。

    騰訊多媒體實驗室是騰訊科技實驗室矩陣之一,也是全球多媒體技術領先者,實驗室工作主要包括標準制定、核心能力建設和產品落地三大板塊。

    在標準制定方面,李松南指出,騰訊多媒體實驗室一直積極參與國際、國內的視頻編解碼標準制定,以最新的H.266標準為例,實驗室有超過100個提案被采納,在國際范圍內處于領先位置。

    在視頻核心能力建設方面,騰訊多媒體實驗室在視頻編解碼、處理、理解、沉浸式等很多方向上都取得了快速的進展。以沉浸式為例,去年多媒體實驗室為“一部手機游云南“項目提供了VR360視頻技術,這個項目結合白沙細樂 熱美磋等多項云南非物質文化遺產內容,為云南旅游景點提供了精細化的導游導覽方案。

    在產品落地方面,實驗室今年在業界首次推出了沉浸式展廳的解決方案,在騰訊數字生態大會期間同步上線的‘云上展廳’就是基于此方案打造的, AR、VR、點云、云渲染等多項實驗室自研的沉浸式技術藏于各展區之中。同時實驗室現也積極合作騰訊云推出更多沉浸式通用產品與解決方案。

    關于多媒體視頻技術的發展趨勢,李松南表示,相信在5G、大數據 、云計算的加持下,AI 、沉浸式以及視頻編解碼技術會得到更進一步的發展。騰訊多媒體實驗室會在這些領域持續深耕,努力為騰訊以及外部企業的各種To B、To C產品提供更好的視頻技術服務?!矩熑尉庉?古飛燕】

    以下為李松南生演講全文:

    大家好,我是來自騰訊多媒體實驗室的視頻技術總監李松南。很榮幸能代表實驗室參加騰訊全球數字生態大會的視頻通訊云專場。接下來我為大家介紹一下騰訊多媒體實驗室的視頻技術以及我個人對視頻技術的展望。

    隨著網絡基礎設施的不斷建設、網速的加快及網絡費用的下降,以及UGC、 PGC、短視頻、長視頻及直播等視頻內容與形式的極大豐富,視頻應用的場景越來越多,會議、電商、社交、娛樂、教育、醫療、智慧城市、視頻幾乎無處不在。

    隨著科技的發展,視頻技術也變得越來越成熟,在越來越多的應用場景中得到使用。視頻技術有很多種,這里我給出了三個關鍵詞,分別是8K、沉浸式和AI。它們是多媒體實驗室在持續投入的方向,同時也是我個人認為比較關鍵的視頻技術。

    下面我將圍繞這三個關鍵詞,對視頻技術進行簡要的回顧和展望。

    第一個關鍵詞是 8K。提到8K,消費者首先想到的是大畫面、高畫質。但是企業主想到的則是高帶寬、高存儲等導致的高成本,所以 8K很早就被提出來,但是普及還需要下一代視頻技術的支撐,其中最關鍵的技術之一就是視頻編解碼。

    視頻編解碼技術可以幫助我們用更低的帶寬來提供更好的畫質,每一代的編解碼標準幾乎都可以在畫質不變的情況下將碼率降低一半。在視頻為王的今天,視頻碼率的降低對成本的節省是巨大的。騰訊多媒體實驗室積極參與國際、國內的視頻編解碼標準的制定,以最新的H.266標準為例,我們有超過100個提案被采納,在國際范圍內處于一個領先的位置。

    每一代視頻編碼標準的普及都離不開視頻編解碼算法在架構層級、算法層級以及在指令層級的深度優化。這里列出的是實驗室開發的視頻編解碼引擎支撐到的騰訊內部產品,包括騰訊會議、云游戲、手機QQ、全民K歌、視頻云、騰訊視頻等等。實驗室在跟進標準、擴大騰訊國際影響力的同時也在切切實實的服務我們的產品,做到上得廳堂下得廚房。

    與8K相關的另外一個視頻技術是視頻處理??紤]到8K的內容有限,普及8K技術需要我們使用視頻處理,將4K或者是更低分辨率的內容提升到8K的畫質。除了分辨率以外,8K往往還伴隨著幀率的提升、位深度的提升、色域度的擴展等等,這些都是視頻處理技術的范疇,同時也是實驗室從建立之初一直在堅守的視頻技術方向。

    視頻處理可以把4K變成8K,是否可以把老電影也搬上熒屏呢?騰訊影業投資的電影《追光萬里》就使用了實驗室的老片修復技術。我們在和騰訊視頻云合作PaaS產品——畫質重生;與騰訊影業合作SaaS產品——智慧影視。目標是把不同年代的影視劇重新搬上電視 ,甚至搬上銀幕。

    第二個關鍵詞是沉浸式。不論是8K還是沉浸式, 目標都是提升用戶的體驗。不同的是,8K是2D的、是被動的,而沉浸式是有交互的、是3DoF的、甚至是6DoF的。

    這里簡單的解釋一下,3DoF代表的是三自由度,英文全稱是Three Degrees of Freedom。意思是你在點頭、搖頭和側轉頭的時候可以看到不同的畫面。這樣的方式與人們觀察日常世界的方式更為接近,因此也就更具有沉浸感。3DoF最典型的應用就是VR360視頻,這頁PPT中展示的是實驗室在VR360視頻方面的一些工作,其中包含了從采集 、壓縮、傳輸到渲染端到端的每一個步驟。去年多媒體實驗室為“一部手機游云南“項目提供了VR360視頻技術,這個項目結合白沙細樂、熱美磋等多項的云南非物質文化遺產內容,為云南旅游景點提供了精細化的導游導覽方案。

    3DoF更進一步就是6DoF,在3DoF 也就是頭部旋轉的基礎上,我們上下、左右、前后移動 ,也可以看到不同的內容。VR游戲是6DoF的 ,擴展現實也是6DoF的。6DoF中會用到很多三維重建的技術,比如點云重建、網格重建等等,這些技術可以用在比如虛擬看房 、虛擬看車等很多的場景中,為用戶帶來更加身臨其境的產品體驗。

    最后一個關鍵詞是AI ,也就是人工智能。今天我們談到人工智能的時候,往往指的就是深度學習技術。這幅圖里給出了從媒體生產到云服務,再到媒體消費的一個典型的流程。其中涉及到了很多與視頻技術相關的模塊,幾乎每一個模塊都可以用到深度學習技術,包括前面提到的視頻編解碼 、視頻處理、 AR /V、三維重建等等,目前都在逐步的AI化。

    這里我們給出了實驗室在AI方向的幾個應用場景,比如說在媒體生成方面,我們可以利用AI結合多模態,針對體育、游戲、影視等場景實現精彩視頻的生成。以足球視頻為例,我們可以把一場足球比賽按照不同的事件進行拆分,比如射門、角球、犯規等等,然后我們可以把我們認為精彩的鏡頭拼接在一起,再配合上一段動感的音樂,從一段長視頻一鍵生成短視頻。

    在云計算方面,實驗室提供諸如視頻標簽、優質視頻推薦及顏值預測等功能,對用戶上傳的海量視頻進行打標,為視頻推薦、視頻搜索等產品提供技術支撐。用戶每天會上傳海量的UGC視頻,為所有的UGC視頻進行人工打標簽是不太可能的,使用AI打標簽就可以很大程度上降低人工打標的工作量,并降低成本。在媒體消費端,我們可以對用戶的行為進行分析,實現諸如用戶行為理解、人機交互這些基礎功能,幫助我們更好的理解和服務消費者。在這段視頻里展示的是用身體的動作來控制視頻畫面的內容,類似的動作分析技術,還可以幫助我們用手勢與電視進行交互等等。

    相信在5G、大數據、云計算的加持下,AI 沉浸式以及視頻編解碼技術會得到更進一步的發展。騰訊多媒體實驗室會在這些領域持續的深耕,努力為騰訊以及外部企業的各種To B、To C產品提供更好的視頻技術服務。

    感謝各位的聆聽 !

    來源:IT時代網

    IT時代網(關注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創文章版權所有,未經授權,轉載必究。
    創客100創投基金成立于2015年,直通硅谷,專注于TMT領域早期項目投資。LP均來自政府、互聯網IT、傳媒知名企業和個人。創客100創投基金對IT、通信、互聯網、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創客100基金最顯著的特點。

    相關文章
    騰訊李松南:8K、沉浸式和AI是視頻技術的3個關鍵詞
    要是大家都用 AI 預測航班延誤,延誤險還能存在嗎?
    【特別報道】AI為“戰疫”做的那些事
    國內AI芯片巨頭寒武紀擬科創板上市

    精彩評論