面對同一個月亮,每一個人會有不同的心境,今年元宵節AI讓每一個人都有一個與眾不同的“月亮”:用戶只需要選定希望賞月的地點,百度飛槳文心大模型就能快速理解并聯想創意,運用習得的知名藝術家的技法和畫風,創作出符合主題的畫作。比如,國際奧委會成員小薩馬蘭奇想看他家鄉西班牙的月,AI就畫出一副南歐風景,畫風也是西式油畫。短道速滑運動員韓天宇想看北京的月,AI畫風也切換得更像中式山水。重點是,所有這些畫都是AI全新創作的,在網上不會有一模一樣的,是每一個用戶的“專屬”福利。
每個人都可以畫出一幅代表自己的獨享月景美圖,這背后是百度AI。
以前,作畫有著很高的門坎,心中有感但無從下筆讓很多用戶心生遺憾。隨著AI能力的提升,AIGC(AI generated content,即通過人工智能技術來自動生成內容的生產方式)讓內容生產變得更容易、更個性。你會發現,今天的AI已經可以寫詩、作曲、繪畫、剪輯、翻譯,應用范圍不斷擴大,逐漸成為內容生產的一支重要力量。
當年UGC、PGC的興起,使得內容產業的繁榮度邁上一個新的臺階,而今天AIGC的興起,不僅會將內容產業的繁榮推向新的高度,也將對社會的演進產生更深遠的影響。
內容需求引爆AIGC
我們正在走向智能世界,AI的應用將無處不在。內容創作領域,AI也在不斷深入。
2016年里約奧運會上,一個可以寫稿的機器人記者亮相,它可在賽事結束兩秒內出稿,效率大大高于人類。六年后的北京冬奧上,百度智能云聯合央視新聞推出了AI手語主播,這個數字人,可以24小時不間斷為觀眾播報奧運賽況,而且不像寫作那種單線程作業,她需要根據真人主播語音、實時視頻畫面,轉換成手語手勢,是更為復雜的創作。
這其中我們看到一個顯著的變化:以前AI只是輔助內容創作的工具,而今天AI已經可以成為創作的主體,能夠獨立完成寫作、設計、繪畫等創意性工作。雖然大家普遍認為今天的AIGC還比較初級,但行業正在發生質的變化。
如果說寫作、剪視頻是某個專業領域的專用人工智能,AIGC更像是通用人工智能的應用。專用人工智能面向特定任務,任務單一、需求明確、應用邊界清晰、領域知識豐富、建模相對簡單。而通用人工智能,就像人的大腦,能舉一反三、融會貫通,可處理視覺、聽覺、判斷、推理、學習、思考等各類問題,可謂“一腦萬用”。
比如這兩年大火的數字人就是AIGC的一個典型代表。此前,百度推出了百度智能云曦靈數字人平臺——集數字人生產、內容創作、業務配置服務為一體的平臺級產品。如今,用戶在百度智能云曦靈平臺上傳一張照片,就能快速生成一個可被AI驅動的2D數字人像,以前需要兩三個月時間做出來的3D數字人,現在可以壓縮到小時級,同時基于百度多年的AI技術沉淀,一站式實現數字人的“能聽、能說、能理解、可互動”,進一步降低數字人的應用門檻。
隨著AI技術的成熟,今天數字人已經在互娛、金融、政務、零售等更多行業發揮作用。比如百度最近發布的數字虛擬偶像希加加,它不僅有具有語言、面部表情和肢體動作表達能力,能夠像人一樣對話、行動,更重要的是可進行自主學習及迭代,還可以基于AI能力進行創作快速生成內容。目前,百度打造的數字人已遍布各行各業,除了前面提到的央視新聞AI手語主播,還有央視網虛擬小編小C、百度App代言人龔俊數字人、交行信用卡客服數字人等,為不同應用場景提供虛擬數字人服務。
從AI寫作、AI繪畫、AI作曲、AI設計,到數字人,AIGC火爆的背后是用戶對于內容的需求得不到滿足,迫切需要內容產業升級迭代。
首先,文無第一、文無定形都是自古以來就有的說法,這背后是用戶對內容審美的個性化,同一篇文章、同一幅畫、同一款設計,每個用戶的喜愛程度都不同。特別是當下Z時代年輕人已經成為互聯網內容的消費主體,他們的個體意識很強,每一個人都是獨立的思維主體,不盲目從眾,這對內容的個性化、分眾化、豐富化提出更高的要求。
其次,在移動互聯網普及下,內容形態也不斷豐富,文字、圖片、音樂、短視頻、直播、游戲,內容需求無處不在,用戶每天消費的內容不斷增加,但是靠人力創作已經很難滿足需求的增長。即使是UGC、PGC普及,但所有的創作對專業性都有一定的要求,創作者的數量和能力成為內容增長的瓶頸。
最后,我們看得更遠一些,無論是元宇宙還是Web3.0,下一代互聯網的繁榮也需要海量的數字內容,同時對內容的數量、形式和交互性都提出了更高的要求。從這個角度看,AIGC顯得尤為必要。如果說,UGC、PGC是Web2.0時代的標志之一,那么AIGC將是Web3.0的重要標志,AIGC的興起也是通往元宇宙的必經之路。
生產工具的進化,大模型讓AIGC成為可能
生產力是推進社會變革的根本動力,生產工具則是生產力發展水平的客觀尺度,也是劃分經濟時代的物質標志。從鉆木取火到機器大生產,從電氣化到人工智能,生產力的發展帶動社會躍遷。相比UGC、PGC,AIGC是生產工具的變革,對于內容產業的影響也更大。
這個生產工具就是AI大模型。所謂大模型,是相對小模型來說的。過去的幾年,AI模型基本上是針對特定應用場景需求進行訓練的小模型。小模型有幾個弊端,一是通用性差,它常常是利用特定領域的數據進行訓練,無法適用另一個場景;二是自動性差,需要AI工程人員進行手工調參、調優;三是需要大量數據,如果數據量少,訓練出來的模型精度會存在問題。
大模型當然比小模型規模大,它是大數據集和大算力的結合,能夠顯著克服上述弊端。首先,它的通用性更強,比如百度推出的文心大模型,面向不同的任務、在不同的應用場景里做少量任務數據進行遷移學習,就可以應用于很多場景。其次,它不需要大量標注數據,同一模型利用少量數據進行微調或不進行微調就能完成多個場景的任務。再次,它不像小模型那樣需要AI工程人員手工調參,更像是“無人駕駛”。
以往的AI寫詩,就是依賴小模型,提前給人工智能輸入海量詩句相關數據,就可以做到AI寫詩,但這一模型僅適用于寫詩,無法用在寫新聞、剪視頻等場景。但有了大模型,AI不僅可以寫詩,還能寫新聞、剪視頻、播音,甚至作曲。換句話說,大模型之前,AI只能單一實現聽、讀、寫,大模型之后,AI可以同時聽說讀寫,變得更加聰明。
如果說,小模型是“白盒”模式,輸入什么數據,在盒子里如何流動如何輸出需要AI工程人員操作,也就是說外界可以看得一清二楚。而AIGC則是“黑盒”模式,輸入數據后到產出結果之間,外界看不到。它的工作原理更像人類大腦,就像作曲家創作一首傳世曲目,人們都覺得好聽,但無法知道他的大腦是如何運轉、怎么完成創作的。
動畫片《海爾兄弟》第一集有這樣一個畫面,全世界的書籍、電腦、電視里的文字、視頻、音頻等一起被吸進“海爾兄弟”的身體。當海爾兄弟睜開雙眼,他們便具備了全世界最聰明的腦袋,能看、能聽、能說。從這一點看,大模型的運作模式跟海爾兄弟有些類似。
文章開頭提到的AI手語主播,不僅有“好看的皮囊”,還有“有趣的靈魂”,能“聽懂”真人主播的話,并實時轉換成手語動作。她就是依賴于百度文心大模型。
百度文心大模型有兩大特點,亦是優勢:一是文心大模型具備“知識增強”的核心特色,因此學習效率更高、效果更好,具有通用性好、泛化性強的特點。二是可以做到跨模態。什么是模態?文字、聲音、圖像都是一種模態,跨模態就是人工智能可以做到像人一樣同時聽懂語音、看懂圖像視頻、理解語言。
正是基于這樣的特點,百度AI可以更好地支撐AIGC落地。比如,知識增強跨模態生成大模型ERNIE-ViLG,具備圖文雙向生成能力,既可以根據文本自動創作符合文字描述、且效果逼真的圖像,也可以理解畫面,用簡潔的語言描述畫面的內容,還夠根據圖片中的場景回答相關的問題。再比如全球首個知識增強的千億大模型鵬城-百度·文心,具備零樣本生成能力,無需標注任何樣本,便可以根據用戶指定的體裁、情感、長度、主題、關鍵詞等屬性,生成不同類型的文本。
內容創作的一小步,有可能是社會演進的一大步
未來的AI時代到底是什么樣的?元宇宙與物理世界會是什么樣的關系?未來可能還不清晰,但是人類確實是在不可逆的走向智能時代。未來,AI會改變很多行業。今天我們看到的AIGC是內容創作行業向前邁進了一小步,同時也可能會是社會演進的一大步。
創作似乎一直是人類的專利,從遠古時代的巖壁繪畫,到后來的詩詞歌賦,能歌能舞能寫能畫能是人類區別于其他動物的重要標志。盛唐時,李太白斗酒詩百篇,酒精激發無限靈感;新時代,AIGC無需創作靈感,更將創作特權賦予機器、虛擬人,讓人類不再“孤單”。毫無疑問,AIGC是具有劃時代意義的里程碑。
首先,AIGC將為內容生產領域帶來巨大變革。一方面,它可以激發創意認知,豐富內容生產的多樣性以及提供更加動態且可交互的內容,創造的內容高度定制化、個性化;另一方面,它也將提升內容生產效率,降低創作門檻,進而實現大規模應用,快速“補位”數字世界內容供給缺口,助力內容生產實現跨越式發展。
從長遠看,AIGC將對人類產生諸多深遠影響。
比如,AIGC還將影響其他產業領域的發展。AIGC作為新的生產力,其“聽說讀寫”能力還可以應用到更多領域。比如文娛產業,最近兩年很火的虛擬偶像,就需要AIGC的支撐,AIGC可以幫助其像真人一樣思考、說話、唱歌、跳舞,并沿著固定的風格,構建穩定“人設”。再比如,費時費力的客服行業,中國聯通與百度,基于文心大模型,建立了面向對話理解問題的專用預訓練模型,在保持優異應用效果的同時,降低了45%以上的數據標注量,顯著提升了智能客服業務開展效率。
從更長遠的角度看,AIGC也將逐步影響人們的思考和生活方式。傳播學中有“守門人”理論、“議題設置”理論等等,來反映信息傳播過程中人為控制的部分,在跨地域、跨民族傳播中,還有刻板印象、有色眼鏡等標簽。傳統的PGC、UGC、OGC內容生產,不可避免的帶有上述痕跡,也無法擺脫上述困境。但依靠僅需少量數據輸入,便可“無人駕駛”的AIGC就有望擺脫這些困境,真正產出客觀、公正的內容。
當然,這些都只是AIGC發展初期的想象。目前,AIGC還處于發展初級階段,但假以時日,它將成為“全才”進而幫人們實現創作。AI或許會打開內容創作的潘多拉魔盒,會有更多的意想不到在未來發生。就好比《三體》中三體人思維是透明的,且不會隱藏。也許,數百年后,在AIGC的影響下,人類也會如此。那將會是一個什么樣的世界?