AI大模型對影像生產(chǎn)邏輯的影響

來源:網(wǎng)絡視聽
關鍵字:AI,模型,影像
發(fā)布時間:2024-07-06 19:40

　　文/張洪忠

　　所謂大模型，是指將海量數(shù)據(jù)導入具有億量級參數(shù)的深度學習模型，由機器學習數(shù)據(jù)中蘊含的特征、結構，最終模型被訓練成具有邏輯推理和分析能力的人工智能。簡單地說，大模型具有人一樣的對話能力，能夠理解人的意思，根據(jù)對語言的理解、生成圖像、視頻等。目前，以ChatGPT為代表的大語言模型應用成為互聯(lián)網(wǎng)空間新生態(tài)，開放域多輪對話與生成式技術突破帶來傳播研究新變化。我們從三個方面來看，首先是大模型的技術突破，其次是大模型如何改變影像的生產(chǎn)方式，最后是人類在這一過程中還能發(fā)揮怎樣的作用。

　　一、大模型技術在人機關系中突破了什么？

　　大模型給我們帶來了什么？大模型技術突破的核心在于語言處理能力的飛躍，像 ChatGPT 由單輪對話突破到多輪對話，這就是整個大語言模型帶來的巨大技術突破。過去，人工智能在進行人機對話時，主要依賴匹配法，機器無法真正理解人類語言深層含義。例如，當詢問機器是否了解成龍時，機器能夠給出肯定回答，但進一步詢問關于成龍的兒子時，機器便無法回應。這顯示了機器在理解人類語言方面的局限性。

　　但是，當2022年年底ChatGPT出現(xiàn)以后，機器具備了交互能力，實現(xiàn)了多輪對話功能。這意味著機器有了類似人類的語言能力，人類文明發(fā)展的關鍵就是語言，這才是最核心的點。我們在2021年對語言處理技術進行過深入探討時，當時很多人認為，對話是機器難以逾越的障礙。然而，ChatGPT的出現(xiàn)卻讓我們看到了機器在多人對話方面的巨大潛力。

　　大模型發(fā)展呈現(xiàn)多模態(tài)發(fā)展模式。多模態(tài)是指不同類型信息模式同時被利用，如文字、圖像、聲音等。過去，我們的傳媒產(chǎn)業(yè)都是按單模態(tài)來布局，如今，大模型技術發(fā)展，Sora等平臺出現(xiàn)，為我們帶來了多模態(tài)發(fā)展的可能性。一個對話成為一個平臺，這是影像生產(chǎn)、傳媒變革的趨勢，是單模態(tài)變?yōu)槎嗄B(tài)的發(fā)展。大模型推動了跨語言發(fā)展。我們以前經(jīng)常會提及“地球村”概念，但在互聯(lián)網(wǎng)時代，不同語言之間是一個網(wǎng)絡，如日語、阿拉伯語與漢語不是互通的，但是大模型會打破其邊界，使全人類能夠共同參與某一個內容的生產(chǎn)。這一變革意味著人工智能技術從簡單模仿向更復雜、更全面的方向發(fā)展，從原本的鸚鵡學舌進化為真正具有語言和多模態(tài)能力的人類智慧。

　　二、大模型時代的影像生產(chǎn)方式會發(fā)生什么變化？

　　大眾時代是點到面的中心化傳播，隨后，我們進入了分布式網(wǎng)絡結構，即社交媒體的網(wǎng)狀形態(tài)，信息從A到B到C到D傳遞。進入大模型時代，我們再度回到中心化，即所有人通過大模型進行對話。在這一過程中，所有人生產(chǎn)的內容構成了大眾生產(chǎn)的大模型內容。由于大模型基于無數(shù)人類的大數(shù)據(jù)生成，實質上是個體與大眾的對話，也構成了一種新型人際關系。

　　大模型為我們帶來了新的人際關系，人機對話變成了個體與眾人的對話。首先，最為明顯的變化體現(xiàn)在創(chuàng)意領域。個體創(chuàng)意已經(jīng)不再是唯一，而是與機器、眾人的創(chuàng)意相互交織。如之前所提及的案例所示，許多原本需要個體投入大量思考和創(chuàng)意的生產(chǎn)任務，現(xiàn)在可以由機器輔助甚至完全取代。無論是文本創(chuàng)作，還是視頻制作，這種變革已經(jīng)悄然發(fā)生。

　　其次是制作方式的改變，人的生產(chǎn)變?yōu)闄C器參與的生產(chǎn)。例如，在音樂方面，我們只要輸入指令，便可通過機器自動生成作品。

　　第三是影像生產(chǎn)機制在發(fā)生改變，傳統(tǒng)團隊協(xié)作方式正在被個體行為所替代。我們以往要制作一部影片，需要有很多團隊相互協(xié)作；現(xiàn)今，個體便能夠獨立完成這些工作，無須再依賴團隊協(xié)作。這對整體影像產(chǎn)業(yè)產(chǎn)生巨大影響，有些工作或者工種有可能會被機器替代。在這樣的轉變之下，我們不得不思考：人在影像產(chǎn)業(yè)中還能扮演什么角色？

　　三、大模型時代下人類還能做什么？

　　在影像制作領域，我們發(fā)現(xiàn)其核心主要依賴人類的創(chuàng)意、構思與制作，這種生產(chǎn)方式，已經(jīng)沿襲了數(shù)十年。然而，大模型時代，機器創(chuàng)意與機器制作已逐漸變?yōu)楝F(xiàn)實。那么，在這樣的變革下，人類角色發(fā)生了怎樣的轉變？其實，無論技術怎么發(fā)展，它依然需要依靠人的想法和選擇。這也為我們提供了一個巨大發(fā)展機會，那就是提示工程，這一領域需要大量的人力投入。例如，從去年開始，北師大傳播學院就開始訓練學生如何進行提示工程，如何在現(xiàn)有模型基礎上開發(fā)新技術。這正是人類強項所在。我們可以根據(jù)自己的需求和創(chuàng)意來制定提示詞，從而推動提示工程發(fā)展，所以“人的想法”很重要。

　　再就是人的選擇，在創(chuàng)作大量圖片時，個人審美和選擇能力將直接影響作品質量。每個人的選擇都是不同的，選擇能力決定了作品的水平高低。在今后的工作中，在創(chuàng)意和生產(chǎn)環(huán)節(jié)中的工作逐漸被大模型分流和取代的情況下，我們將更加注重提示工程和審美選擇工程的發(fā)展，以適應大模型時代的發(fā)展需求和挑戰(zhàn)。同時，我們需要關注這一技術對社會、經(jīng)濟、文化等方面的影響，制定相應措施和政策，確保大模型技術健康發(fā)展。

　　（本文整理自2024年第十一屆中國網(wǎng)絡視聽大會發(fā)言。作者張洪忠系北京師范大學新聞傳播學院院長，北京師范大學新媒體傳播研究中心主任、教授）

關注讀覽天下微信， 100萬篇深度好文，等你來看……

立即購買本期雜志

查看本期更多內容

亚洲,欧美,中文字幕,小婕子伦流澡到高潮视频,无码成人aaaaa毛片,性少妇japanesexxxx,山外人精品影院

AI大模型對影像生產(chǎn)邏輯的影響