AI大模型對影像生產(chǎn)邏輯的影響
- 來源:網(wǎng)絡視聽 smarty:if $article.tag?>
- 關鍵字:AI,模型,影像 smarty:/if?>
- 發(fā)布時間:2024-07-06 19:40
文/張洪忠
所謂大模型,是指將海量數(shù)據(jù)導入具有億量級參數(shù)的深度學習模型,由機器學習數(shù)據(jù)中蘊含的特征、結構,最終模型被訓練成具有邏輯推理和分析能力的人工智能。簡單地說,大模型具有人一樣的對話能力,能夠理解人的意思,根據(jù)對語言的理解、生成圖像、視頻等。目前,以ChatGPT為代表的大語言模型應用成為互聯(lián)網(wǎng)空間新生態(tài),開放域多輪對話與生成式技術突破帶來傳播研究新變化。我們從三個方面來看,首先是大模型的技術突破,其次是大模型如何改變影像的生產(chǎn)方式,最后是人類在這一過程中還能發(fā)揮怎樣的作用。
一、大模型技術在人機關系中突破了什么?
大模型給我們帶來了什么?大模型技術突破的核心在于語言處理能力的飛躍,像 ChatGPT 由單輪對話突破到多輪對話,這就是整個大語言模型帶來的巨大技術突破。過去,人工智能在進行人機對話時,主要依賴匹配法,機器無法真正理解人類語言深層含義。例如,當詢問機器是否了解成龍時,機器能夠給出肯定回答,但進一步詢問關于成龍的兒子時,機器便無法回應。這顯示了機器在理解人類語言方面的局限性。
但是,當2022年年底ChatGPT出現(xiàn)以后,機器具備了交互能力,實現(xiàn)了多輪對話功能。這意味著機器有了類似人類的語言能力,人類文明發(fā)展的關鍵就是語言,這才是最核心的點。我們在2021年對語言處理技術進行過深入探討時,當時很多人認為,對話是機器難以逾越的障礙。然而,ChatGPT的出現(xiàn)卻讓我們看到了機器在多人對話方面的巨大潛力。
大模型發(fā)展呈現(xiàn)多模態(tài)發(fā)展模式。多模態(tài)是指不同類型信息模式同時被利用,如文字、圖像、聲音等。過去,我們的傳媒產(chǎn)業(yè)都是按單模態(tài)來布局,如今,大模型技術發(fā)展,Sora等平臺出現(xiàn),為我們帶來了多模態(tài)發(fā)展的可能性。一個對話成為一個平臺,這是影像生產(chǎn)、傳媒變革的趨勢,是單模態(tài)變?yōu)槎嗄B(tài)的發(fā)展。大模型推動了跨語言發(fā)展。我們以前經(jīng)常會提及“地球村”概念,但在互聯(lián)網(wǎng)時代,不同語言之間是一個網(wǎng)絡,如日語、阿拉伯語與漢語不是互通的,但是大模型會打破其邊界,使全人類能夠共同參與某一個內容的生產(chǎn)。這一變革意味著人工智能技術從簡單模仿向更復雜、更全面的方向發(fā)展,從原本的鸚鵡學舌進化為真正具有語言和多模態(tài)能力的人類智慧。
二、 大模型時代的影像生產(chǎn)方式會發(fā)生什么變化?
大眾時代是點到面的中心化傳播,隨后,我們進入了分布式網(wǎng)絡結構,即社交媒體的網(wǎng)狀形態(tài),信息從A到B到C到D傳遞。進入大模型時代,我們再度回到中心化,即所有人通過大模型進行對話。在這一過程中,所有人生產(chǎn)的內容構成了大眾生產(chǎn)的大模型內容。由于大模型基于無數(shù)人類的大數(shù)據(jù)生成,實質上是個體與大眾的對話,也構成了一種新型人際關系。
大模型為我們帶來了新的人際關系,人機對話變成了個體與眾人的對話。首先,最為明顯的變化體現(xiàn)在創(chuàng)意領域。個體創(chuàng)意已經(jīng)不再是唯一,而是與機器、眾人的創(chuàng)意相互交織。如之前所提及的案例所示,許多原本需要個體投入大量思考和創(chuàng)意的生產(chǎn)任務,現(xiàn)在可以由機器輔助甚至完全取代。無論是文本創(chuàng)作,還是視頻制作,這種變革已經(jīng)悄然發(fā)生。
其次是制作方式的改變,人的生產(chǎn)變?yōu)闄C器參與的生產(chǎn)。例如,在音樂方面,我們只要輸入指令,便可通過機器自動生成作品。
第三是影像生產(chǎn)機制在發(fā)生改變,傳統(tǒng)團隊協(xié)作方式正在被個體行為所替代。我們以往要制作一部影片,需要有很多團隊相互協(xié)作;現(xiàn)今,個體便能夠獨立完成這些工作,無須再依賴團隊協(xié)作。這對整體影像產(chǎn)業(yè)產(chǎn)生巨大影響,有些工作或者工種有可能會被機器替代。在這樣的轉變之下,我們不得不思考:人在影像產(chǎn)業(yè)中還能扮演什么角色?
三、大模型時代下人類還能做什么?
在影像制作領域,我們發(fā)現(xiàn)其核心主要依賴人類的創(chuàng)意、構思與制作,這種生產(chǎn)方式,已經(jīng)沿襲了數(shù)十年。然而,大模型時代,機器創(chuàng)意與機器制作已逐漸變?yōu)楝F(xiàn)實。那么,在這樣的變革下,人類角色發(fā)生了怎樣的轉變?其實,無論技術怎么發(fā)展,它依然需要依靠人的想法和選擇。這也為我們提供了一個巨大發(fā)展機會,那就是提示工程,這一領域需要大量的人力投入。例如,從去年開始,北師大傳播學院就開始訓練學生如何進行提示工程,如何在現(xiàn)有模型基礎上開發(fā)新技術。這正是人類強項所在。我們可以根據(jù)自己的需求和創(chuàng)意來制定提示詞,從而推動提示工程發(fā)展,所以“人的想法”很重要。
再就是人的選擇,在創(chuàng)作大量圖片時,個人審美和選擇能力將直接影響作品質量。每個人的選擇都是不同的,選擇能力決定了作品的水平高低。在今后的工作中,在創(chuàng)意和生產(chǎn)環(huán)節(jié)中的工作逐漸被大模型分流和取代的情況下,我們將更加注重提示工程和審美選擇工程的發(fā)展,以適應大模型時代的發(fā)展需求和挑戰(zhàn)。同時,我們需要關注這一技術對社會、經(jīng)濟、文化等方面的影響,制定相應措施和政策,確保大模型技術健康發(fā)展。
(本文整理自2024年第十一屆中國網(wǎng)絡視聽大會發(fā)言。作者張洪忠系北京師范大學新聞傳播學院院長,北京師范大學新媒體傳播研究中心主任、教授)
