雲計算

超視頻化到來,你能看見什麼?

當人類優渥於一種狀態,總有想象力衝破平衡。

1905 年,愛因斯坦否定了絕對時空,引發物理世界三大革命。楊振寧曾說過,“愛因斯坦沒有錯失重點,是因為他對時空有著更自由的眼光。而要有自由的眼光,必須能夠同時近觀和遠觀同一課題。”

2021,阿里雲視頻雲全景創新峰會,努力嘗試站在近景和遠景之處,全景觀察這個時代的超視頻化課題。

image.png

這是個怎樣的時代?

這是超視頻化時代。

視頻讓流淌的文字和圖像演化成時代語言,視頻把情緒、立場、眼界、思維立體化封裝。視頻在時間域和空間域,不斷地破維和延伸。

視頻化是一場博物學,包羅文字、影音,包羅空間、引力,包羅人文、情感,它呈現沒有邊界的世界圖景,它表達自由和創造新自由。

image.png

在超視頻化時代,視頻衍生了更多新形態,構建了全新的內容鏈條,所謂超內容;視頻化逐漸演變成以人為中心的交互,承載了多維感官、甚至超越時空的體驗,所謂超交互;視頻化讓萬物皆媒,人與人、人與物、人與自然,感應式鏈接,產生一種超社交能力和現象,所謂超鏈接

視頻成為全新的時代語言,視頻化成為新世紀的新文化運動;而超未來的另一端,現實世界與虛擬世界的物理感知界限將模糊化,最終實現全場景的數字孿生。

當然,5G 是這個時代演進的助推器,讓萬物互聯。而 “雲 + 視頻 “是場景革新的催化劑,讓虛實融合。

隨之,一切內容和交互,都將在這個時代發生聚變。

內容和交互的盡頭在哪?

先談內容。

技術,各式各樣的技術,首先是在呈現一個意義的世界。

技術製造意義並傳遞情感。是這樣的,就像當帶寬承載有限時,人們聚焦信息的傳遞;當帶寬承載高增時,人們通過多維形態信息傳遞的,是情感。喬布斯在 2001 年的訪談中,已經開始期望通過互聯網更多來傳遞情感,今天,視頻雲的技術可以實現。

如果技術助力內容傳遞情感,那回顧內容的演進,可以看到清晰的脈絡:從一行文字、一幅畫、到一部影像,一直發展到今天的直播、短視頻滿溢,再到資訊和知識的視頻化呈現,直至全場景內容的逐漸視頻化,最終演變到以三維化、可交互為主的沉浸式內容形態。而在這一演進過程中,凸顯了更大密度、更多維度、更多感官、拓撲空間的生長力。

如今,我們能提前預感到沉浸式的學習場域,通過 5G、XR、全息投影、數字孿生和雲化網絡等技術的充分融合,將抽象的知識可視化、具象化,打造線上線下無邊界課堂。能把閱讀新聞演化成體驗 “空間新聞 “,利用有限虛擬、超高清技術、3D 和 360 全景技術,讓人獲得置身感與參與感,使新聞行業面臨極大顛覆。更常見的是沉浸式文博,以文旅 IP 結合虛擬 / 增強現實、全息投影、智能交互,形成萬物沉浸、互動敘事的產業雛形。

image.png

在國外,沉浸式演唱會將搬上舞臺,索尼與 Verizon 合作,將於今年冬天推出” 麥迪遜・比爾沉浸式 VR 演唱會 “。據說該體驗結合 3D 動捕、容積捕捉和 3D 重建技術,利用遊戲引擎開發而成。同時,松下也宣佈和 Illuminariums 娛樂公司合作打造了一個大型沉浸式娛樂中心,場內內置 46 臺 4K 投影,結合 LiDAR 傳感器進行交互,還將融合空間音頻,具備高度定製化。

仔細品味,沉浸式內容的形態無限想象。在內容形態中,我們能縱覽到從實體沉浸、虛擬沉浸、虛擬混合沉浸,再到泛在智能沉浸的線性生長路線,而盡頭的內容形態將會通過全域交互的形式重構體驗,帶來千人千面的獨特內容

image.png

再看交互。

《科學的歷程》中提到,“近代思想的一個革命性的變化,就在於從有限封閉的世界走向無限的宇宙。“ 仔細反觀交互的推演,也正是如此。

從線下到線上,一切場景都在試圖騰挪空間,創造無界。基於科技和商業的推動,人們的交互在慢慢轉向全場景線上化,而最終的形態也將是沉浸式的交互關係。不難發現,多端鏈接、多人共享、打破空間、虛實無縫結合,正是這一演進的趨向。而在能看到的終點,人機交互、腦機接口都是探索重點。

如果縱覽交互發展的 60 年,可以分成三個主要發展時代,而未來十年將核心聚焦在人機交互、傳感器、在線社交通信、腦機接口和特徵識別

image.png

資料來源:International Journal of Human–Computer Interaction
《Mapping Human–Computer Interaction Research Themes and Trends from Its Existence to Today: A Topic Modeling-Based Review of past 60 Years》

從交互的視角,信息將從一個交互對象自然地傳遞到另一個交互對象,而數字將與物理共存並增強。從學術上,交互可分為:物理和數字連續體的交互、隱式交互、感官環境與感知交互、公共空間的交互,虛擬現實與增強現實交互。而這終極的沉浸式交互,核心在探索更自然的交互方式,希望釋放人的立體視覺、觸覺、本體感知等能力,讓交互不再侷限於二維視覺通道與視覺反饋

在新交互體察上,最新的 2021CES 給我們展示了 Pollen Robotics 的遠程 VR 操控方案、CareOS 的智能鏡 AR 美容美髮系統,還有全息技術公司 IKIN 公佈的全息配件,可將智能手機或電腦屏幕變成裸眼 3D 效果。當然還有 Fackbook 一直佈局的 VR 社交,試圖在虛擬世界中,嘗試另一種人生。

日前三星公司發佈的《6G 時代遠景報告》曾提到,高度沉浸 XR 與高質量移動式全息體驗,將是 10 年後的普遍場景。

內容和交互的盡頭大概就是沉浸式場域的綜合體,而智能化已經讓我們逐步 “浸入” 到了一個虛實融合的泛沉浸式時代。它不是未來,它正在發生。

生態的供給與 AI 的拿捏

從未來和時代演進穿越回來,放平視線,落在現有內容生態和技術支持層面。

深入視頻化趨勢,來看視頻內容全圖譜視角,整個產業鏈涵蓋了內容生產、營銷傳播、分發平臺、播放終端以及技術支持,而云計算、音視頻技術強力支撐了視頻內容全產業鏈發展。

image.png

在新的視頻文化消費驅動下,新的技術在演進、在應用,新的生產方式和內容形態在誕生。

我們知道,視頻的新文化消費的擴需,一方面需要數字化的短視頻供應系統,一方面需要超高清視頻的生產能力,從而把大眾帶入數字化內容浪潮中、帶入到真正的 8K 時代。

超高清視頻是視頻技術繼模擬、標清、高清後的新一輪代際演進,與 5G、人工智能等同為當今新一代信息技術的重要發展方向。而當前內容生產處於超高清生產最短板,內容服務層的推進發展對超高清商用落地起到決定性作用。

AI 在這當中可以發揮關鍵價值,我們可以這樣思考,把視覺理解成生物和物理兩個層面,生物世界是人的視覺感知,而從物理現象是對光的各種感應,包括光的亮度、細節描述,以及與時間相關的信息

對此, AI 發揮的作用主要分成兩部分,第一也是最基礎的,是對於視頻或者圖像的理解,包括我們常見的分類、打標、檢測、分割等等這些,這也是跟人相關的,因為人一開始是先理解世界的。第二是與生產相關的,比如我們生產、編輯、加工、擦除、擦入等等,還有與底層視覺相關的,就是增強相關,而怎麼能夠在底層視覺上對視頻用 AI 技術賦能,也是其中關鍵。

從 AI 賦予的超高清能力來講,對於視覺,一個非常重要的結果就是全新的視聽體驗,而體驗與很多東西相關。第一是更豐富的細節,比如看一個東西,如果分辨率非常低或本身信息量體驗非常差的東西,怎麼豐富細節,尤其在 8K 即將到來的今天。第二個是更生動的色彩,在色深、色域、亮度層面,這也是體驗非常重要的地方。第三是更沉浸式的體驗,所謂大視角、全景視角、立體聲環繞。此外還要包括在各行各業更廣泛的應用。

image.png

AI 驅動高清往前走,智能是最基本的,而能不能在不同場景自適應去做事情,AI 技術並沒有所謂的普適性的能力,所以在卡通、新聞人物、傳記不同場景中,能夠有很好的系統,而不是單一的模型、萬能的模型去處理,所以能夠自適應的針對不同場景採用最優質的算法,這是很重要的。由此,自適應、高質量、自評估的智能化 AI 技術驅動,正是達摩院著力的關鍵。

在超高清之外,AI 對超內容消費的效率提升,也在強力賦能。

當前用戶碎片化消費時間不斷增加,短視頻的消費用戶規模已超 7.73 億人,短視頻的市場規模超過 2000 億元。但我們都瞭解,在內容供給側,製作一個較高水準的視頻面臨著創意生產困難、工具實現困難的問題,高效的規模化產出則更加困難。就此,阿里大文娛 Media AI 平臺通過 AI 研發可以實現五大功能:動態素材提取、模版視頻生產、智能剪輯技術、智能素材加工、互動特效。

結合自身業務特點,大文娛希望能夠在平臺側,提效率促分發,為行業創造更多更好的產品和工具;在消費側為用戶提供更多的新消費形態和視頻的消費互動新體驗;在行業側,能與更多 B 端的 PGC 或者 MCN 進行合作。

如今,基於技術和生態的聯動,阿里雲視頻雲也正將整個媒體生產的模式提升到一個新的時代 —— 雲端一體的智能生產架構。這一架構包含了內容創意、素材管理、剪輯包裝、渲染與合成四大核心環節,具有云導播、雲剪輯、AI 處理生產等豐富的功能。因此,在雲端一體的架構和 AI 能力的加持下,傳媒行業的內容生產將會賦予更多可能性。這種生產化的模式將會極大地重塑內容行業,讓真正的內容創作者從繁複的重複化勞動中釋放出來,創造出更豐富的內容、形態、模式。

視頻力改變了商業邏輯

時代的演進、技術的加持、生態的聯動,更多是降落在商業落點上。

以往,講互聯網整體的價值的時候,常規去用的就是流量價值,從移動端來講最簡單就是在每個月、每週覆蓋多少設備,但現在我們要用時間數來看。在短短 3 年之內用戶在整個視頻細分產品的花費時間,從一萬六千億分鐘變成四萬八千億分鐘。數字是驚人的。

image.png

面對現象背後的巨大商業空間,該怎麼配合驅動和創新更多,是我們必須思考的。

我們在講視頻傳播時,它的本源是一個信息傳播的載體,信息傳播本身要去分類的話,分為一對一進行交流或傳播,和一對多或者多對多,而另外一個維度上又分為延時和實時。

視頻的承載能力可以與眾多行業來做結合。所以,以前看視頻,我們基本會說視頻行業、視頻賽道,而現階段,我們更會認為所有領域都會如此結合視頻的情況下,它就像雲計算一樣,不再更多的看成一個行業的概念,而是一個互聯網新經濟底層的基礎能力。藉此能力,各個行業可以去做一些創新的事,基於雲、基於視頻,基於視頻雲。

而視頻雲,將會成為行業視頻化的必選項、成為大視頻產業的技術底座。

作為一種數智化基礎設施的存在,視頻雲不僅大幅降低了視頻應用的准入門檻,更通過促進產業效率提升,不斷推動大視頻產業的繁榮。

從需求端思考,視頻雲能夠為企業提供視頻能力或把產品視頻化,可以運用更多生產、處理、傳輸、消費增值能力。比如直播電商是最早深刻感受到的,整個電商主體在發生變化,原來能看到僅僅是幾個大的直播電商,但視頻化賦予了平臺電商化的轉型能力,讓現在的很多內容平臺甚至創業公司都有非常大流量的中心位置,主播可以是電商的中心,而在過去,它是不存在的。

image.png

另外在線教育領域,在線教育摸索很多年都沒有辦法進行完整變現,後來直播的出現讓行業解決了一定的沉浸感問題,學生可以跟老師有更多的互動,可以解決一些學習效率的問題。本質上,視頻化確實解決了一部分教育的沉浸感和效果問題,以致在線教育在過去幾年終於找到它變現的邏輯。對電商和教育領域,艾瑞研究院副總經理徐樊磊的分析是很精準的。

除了目前視頻化滲透率最高的電商和教育,廣閾的互聯網娛樂、傳媒行業的數智化轉型、企業的移動協同辦公,亦是視頻雲技術應用的重點場域。基於視頻雲技術,新的商業場景還在不斷被打開,從新電商、新教育、新社交、新金融、新醫療,乃至更多產業、更多行業的轉型鋪面到來。

時代的演進、視頻的滲透、交互的變革,讓行業的變現邏輯、流量方向、組織形式都在發生巨大的格局變化。

就此,阿里雲視頻雲也聯合艾瑞諮詢共同研究,發佈《2021 中國視頻雲場景應用洞察白皮書》,以雲上創新為視角,全面展現視頻化應用的全場景、全鏈路,針對空間、盲點、機會、案例深度剖析,著力為視頻雲賽道的商業市場奠定重要的實踐價值。

賽事和開源,是社會想象力的放大器

超視頻化的時代,視頻雲的想象力遠不止步於商業場景,更多的是普惠全民、創造多元化的社會價值。

就在今年 2 月,阿里雲聯手英特爾主辦、與優酷戰略技術合作的全球視頻雲創新挑戰賽啟動,這屆大賽是全球首個聚焦於視頻雲技術在全行業的應用與創新領域的比賽,由天池平臺和阿里雲視頻雲承辦,初賽啟動便吸引了來自全球高校的 4600 支參賽戰隊。賽程中,能看到不斷湧現的創新項目,充滿社會向價值和全新生命力,如視覺算法實現的安全停車項目、老人看護項目。

值得一提的是,大賽通過與優酷平臺聯手,提供了一個大規模高精度視頻分割數據集,供參賽選手訓練模型,並最終打磨成視頻分割領域的權威數據集,非常稀有。該數據集具備夯實的數據量級,包攬 18 萬幀以及高達 30 萬的最多視頻目標數據集,在標註精度和內容廣度上均為行業領先。同時,內容類型高度貼合真實場景且場景多元,對於視頻產業具有極高的探索意義。

數據作為信息時代重要的生產要素,被譽為新的動力能源,是人工智能技術發展的重要基礎。

通過與阿里巴巴集團內部的淘寶、天貓、阿里雲、優酷、AE 等業務團隊,以及清華大學、上海交通大學、中國科學院國家天文臺、中國計算機學會、中國中文信息學會、協和醫院、瑞金醫院等外部權威科研機構合作,天池大賽平臺開放了包括電商、金融、物流、醫療、能源等 60 多個有真實業務場景的產業稀缺數據集,為全球計算機視覺的人才培養做出卓越貢獻,為更多技術開發者創造更廣域的空間。

不得不說,激發澎湃能量的技術創新大賽和大規模的權威的開源數據集,為更多維的社會想象賦能,在此基礎上的技術綻放,很讓人期待。

若你也曼妙於沉浸想象裡

歸根結底,無論技術、商業、生態、資源,一切都是為了人的情感和體驗。

科技不斷在和眾多領域發生互滲性,而藝術大概是我們最想觸摸的特別性場域,也是最接近人類內心軟糯情感的神經線。

7.10 的 “Imagine” 阿里雲視頻雲全景創新峰會,從主辦方角度,真切地從想象出發,試圖以一種視覺通道的沉浸感,拉進人與空間的距離。

image.png

image.png

當然,從科技跨界藝術的角度,我們深度關注的,是數字時代的審美創作實現。

我們發現,當代藝術創作者也在不斷憑藉其想象力和跨學科能力,致力科技與藝術的融合創作。在數字交互時代,創作、傳播的藝術行為在全面出新,進而在藝術審美的感覺、體驗和思維方面也在產生深刻變革。審美驅動技術,技術反哺審美。

在數字交互時代,極致的審美追求,是對專業的追求,而專業的背後蘊藏著創作效率、創作能力。技術無疑是幫助創意多感官、多維度實現的重要工具,而基於深度學習的 AI 工具在協助這樣的過程,為創意大腦插上翅膀。

與此,數智化能力對視覺交互的重構,也是非常重要的體驗演進,峰會上以 “跨界智造 “為內核,嘗試呈現一些內容和交互的新體驗裝置,如基於生成對抗網絡及遷移學習技術的卡通智繪、打造實時渲染屏幕的虛擬拍攝、通過面部和動作捕捉技術的虛擬偶像,一切都在探尋基於藝術、基於人的科技新體驗。

以上,便是阿里雲視頻雲在新時代窺見的有限視野,而無限的內容還待想象。

image.png

超視頻化時代,視頻雲無處不在

視頻雲是交叉學科的新領域

是雲端一體的數智化能力

視頻雲是人類未來的想象力

正在開啟一個全新的、無限的、自由的世界

有想象的地方,就有視頻雲。

image.png

本次視頻雲全景創新峰會的所有演講內容,後續會在「 視頻雲技術」公眾號陸續發佈。

「視頻雲技術」你最值得關注的音視頻技術公眾號,每週推送來自阿里雲一線的實踐技術文章,在這裡與音視頻領域一流工程師交流切磋。公眾號後臺回覆【技術】可加入阿里雲視頻雲產品技術交流群,和業內大咖一起探討音視頻技術,獲取更多行業最新信息。

Leave a Reply

Your email address will not be published. Required fields are marked *