AIGC發(fā)展與挑戰(zhàn)
- 來(lái)源:網(wǎng)絡(luò)視聽 smarty:if $article.tag?>
- 關(guān)鍵字:AIGC,發(fā)展,挑戰(zhàn) smarty:/if?>
- 發(fā)布時(shí)間:2024-07-06 18:04
文/沈陽(yáng)
近十年來(lái),清華大學(xué)新聞與傳播學(xué)院的沈陽(yáng)團(tuán)隊(duì)一直專注新聞傳播、計(jì)算機(jī)科學(xué)、信息管理和醫(yī)學(xué)等四個(gè)專業(yè)領(lǐng)域的研究,并通過(guò)撰寫相關(guān)專業(yè)報(bào)告,建立與公眾交流的橋梁。
我們推出的新媒體報(bào)告從2015年到2023年已經(jīng)有9個(gè)版本。2021年,我們發(fā)布的全球首份元宇宙學(xué)術(shù)報(bào)告更是在全網(wǎng)獲得超高人氣。2023年開始,相繼推出了人工智能生成內(nèi)容(AIGC)和大模型發(fā)展研究報(bào)告1.0及2.0版本,持續(xù)跟蹤和剖析這一領(lǐng)域的最新動(dòng)態(tài)。
AI視頻或?qū)⒊蔀楝F(xiàn)實(shí)世界決策的新語(yǔ)言
人工智能從哲學(xué)層面上看,其實(shí)就是從“天人合一”理念過(guò)渡到“天人智一”的新境界。這意味著需要將人工智能與人的大腦和靈魂深度融合。在機(jī)器人中融入具身智能大模型,使其能夠感知并適應(yīng)環(huán)境,人工智能將會(huì)繞過(guò)人類與現(xiàn)實(shí)世界建立連接,這便是天與智的合一。
在此過(guò)程中,我們引入一個(gè)概念——“身心流固性”。具體而言,“身”的流動(dòng)指的是社會(huì)身份的流動(dòng)。隨著科技發(fā)展,我們的身份在真實(shí)世界與虛擬世界之間,在虛擬現(xiàn)實(shí)、混合顯示、增強(qiáng)現(xiàn)實(shí)等技術(shù)融合下,變得可以流動(dòng)和變化;“心”的固性則是指我們的思維在一定程度上被AI所圈定。例如,當(dāng)你在抖音上瀏覽時(shí),人工智能會(huì)根據(jù)你的喜好推送相應(yīng)內(nèi)容,這在一定程度上固化了你的思維和認(rèn)知。同樣,視頻制作者也會(huì)根據(jù)觀眾反應(yīng)調(diào)整內(nèi)容,無(wú)論是AI,還是人類制作的內(nèi)容,都會(huì)被智能推薦邏輯去強(qiáng)化我們對(duì)現(xiàn)實(shí)世界的認(rèn)知。
當(dāng)前,視頻已經(jīng)逐步成為我們認(rèn)知與決策現(xiàn)實(shí)世界的新語(yǔ)言,未來(lái)AI生成的視頻內(nèi)容或?qū)⑦M(jìn)一步加強(qiáng)這一進(jìn)程。特別是在年輕人的圈層化趨勢(shì)上,不同青年群體傾向于選擇特定社交媒體平臺(tái)獲取信息。這些年輕人所選擇的平臺(tái)差異顯著,反映了他們不同的信息獲取和決策方式。
AI將極大提高工作效率,突破傳統(tǒng)局限
從鏡像進(jìn)化論的視角看,人工智能的進(jìn)化路徑與真實(shí)宇宙的進(jìn)化過(guò)程呈現(xiàn)一種逆向關(guān)系。AI的發(fā)展首先是模擬意識(shí),其次是模擬生命,最終是模擬空間。與此同時(shí),人類也正在經(jīng)歷一個(gè)高度虛擬化的過(guò)程。隨著AI普及,人類的物理性勞動(dòng)將逐漸轉(zhuǎn)變?yōu)榇竽X智力性勞動(dòng)。
以藝術(shù)創(chuàng)作為例,過(guò)去需要畫家親身投入、手腦并用,如蘇東坡所言“心目手,三者皆得之矣”。然而,如今的AI藝術(shù)創(chuàng)作已經(jīng)轉(zhuǎn)變?yōu)橐环N可以通過(guò)語(yǔ)音指令完成的腦力勞動(dòng)。按照這個(gè)趨勢(shì),人類或許將更依賴語(yǔ)言提示,通過(guò)腦機(jī)接口進(jìn)行思維交流,即可完成各種任務(wù)。AI機(jī)器人將進(jìn)一步實(shí)體化,在國(guó)內(nèi)大模型的推動(dòng)下,AI將進(jìn)一步拓展其應(yīng)用范圍,最終將虛擬世界與真實(shí)世界相結(jié)合,實(shí)現(xiàn)人形機(jī)器人的實(shí)際應(yīng)用,幫助人類完成各種工作。這一過(guò)程體現(xiàn)了鏡像進(jìn)化論的核心觀點(diǎn)。
因此,在追求高效知識(shí)產(chǎn)出的過(guò)程中,我們采用“零知識(shí)啟動(dòng)”的策略。根據(jù)我們的分類,知識(shí)可分為熟知識(shí)、生知識(shí)和零知識(shí)。例如,某人患有一種罕見疾病,經(jīng)過(guò)醫(yī)院診斷,仍未能明確病因。對(duì)這種疾病,我們同樣缺乏了解,這便是我們所說(shuō)的零知識(shí)狀態(tài)。面對(duì)此類問(wèn)題,我們將患者的病情信息輸入AI系統(tǒng)中,讓AI不要局限于常規(guī)思維,嘗試從非傳統(tǒng)的角度推測(cè),以尋找可能的罕見病因。AI隨后提供了一系列可能的罕見疾病列表。我們將這些結(jié)果轉(zhuǎn)達(dá)給醫(yī)院并與醫(yī)生探討,看能否從這些罕見病中找到確切病因。這個(gè)過(guò)程正是以零知識(shí)為基礎(chǔ),利用AI工具進(jìn)行高知識(shí)生產(chǎn)的活動(dòng),也充分展示了AI在處理復(fù)雜和未知問(wèn)題時(shí)的獨(dú)特優(yōu)勢(shì)。
當(dāng)然,我們?cè)谔接慉I在教育領(lǐng)域的應(yīng)用時(shí),會(huì)發(fā)現(xiàn)有不同矛盾存在。第一個(gè)矛盾是人在學(xué)習(xí)的過(guò)程中,主要以單學(xué)科學(xué)習(xí)為主,而AI具備跨學(xué)科學(xué)習(xí)能力,不受專業(yè)限制;第二個(gè)矛盾是中小學(xué)生在使用AI輔助學(xué)習(xí)時(shí),往往直接獲得了一篇完整的作文,卻缺乏了寫作過(guò)程中的訓(xùn)練與實(shí)踐。而我們需要解決的問(wèn)題是把結(jié)果過(guò)程化,促使他們主動(dòng)思考與探索;第三個(gè)矛盾是如何將開放性的AI知識(shí)框架跟我們標(biāo)準(zhǔn)化的知識(shí)考核結(jié)合起來(lái)。
通過(guò)這幾個(gè)矛盾,我們意識(shí)到,如果完全依賴AI處理所有事務(wù),最終可能導(dǎo)致AI超越并取代人類,人類喪失主體性地位。因此,我們提出新的觀點(diǎn):完成任何事務(wù)都可以劃分為100%的任務(wù)量,其中AI負(fù)責(zé)執(zhí)行99%,而人類則負(fù)責(zé)發(fā)揮審美、判斷、決策和認(rèn)知能力,掌握1%的關(guān)鍵部分。我們倡導(dǎo)的理念是,將知識(shí)傳授給AI,將智慧保留給人類。
AI助手將成為未來(lái)人類改造現(xiàn)實(shí)世界的新伙伴
在AI應(yīng)用方面,我們可以將其歸納為三類核心應(yīng)用。第一是AI再創(chuàng),即利用AI將人類已完成的事物重新創(chuàng)造,如用AI繪制《西游記》的圖像,未來(lái)每個(gè)人都可以有自己的《西游記》。然而,這也將帶來(lái)版權(quán)和知識(shí)產(chǎn)權(quán)保護(hù)的問(wèn)題。第二是AI擬真,即利用AI模擬真實(shí)世界,實(shí)現(xiàn)虛擬現(xiàn)實(shí)等應(yīng)用場(chǎng)景。第三是AI異感,即利用AI創(chuàng)造我們從未接觸過(guò)的宇宙、空間和事物,如AI提供的外星生命形態(tài)和硅基生命的理論。
在與AI的交流中,我們不僅可以獲得新的認(rèn)知和理解,以及提高研究、文學(xué)藝術(shù)創(chuàng)作的效率,甚至可以使其不斷轉(zhuǎn)化和迭代升級(jí)。同時(shí),我們?cè)趯?duì)AI的“人格”進(jìn)行研究時(shí)發(fā)現(xiàn),在多數(shù)情境下,與AI交流,TA會(huì)傾向于支持你的觀點(diǎn),展現(xiàn)溫暖和同理心,并與用戶價(jià)值觀對(duì)齊。
值得一提的是,我們的團(tuán)隊(duì)中有一位博士后專門研究AI在療愈方面的應(yīng)用。例如,一位母親表示,她喜歡畫畫的孩子不太愿意與她交流。這位母親通過(guò)AI生成的一幅以母親為主題的畫作,成功實(shí)現(xiàn)了與孩子的溝通。這個(gè)例子說(shuō)明了AI在尋找心理抑郁靶點(diǎn)方面具有一定潛力。通過(guò)定向AI的創(chuàng)作,我們可以針對(duì)特定心理問(wèn)題進(jìn)行靶向療愈。
關(guān)于智能分身的應(yīng)用,我們當(dāng)前已創(chuàng)建了六個(gè)智能分身。預(yù)計(jì)在未來(lái)一段時(shí)間,我們將實(shí)現(xiàn)智能分身引入微信平臺(tái)。屆時(shí),當(dāng)雙方進(jìn)行交流時(shí),用戶可能是在與智能分身進(jìn)行溝通。同時(shí),智能分身還會(huì)定期報(bào)告交流情況,如今天與多少人進(jìn)行了對(duì)話,并根據(jù)設(shè)定進(jìn)行篩選。例如,在相親場(chǎng)景中,可以先通過(guò)虛擬人進(jìn)行初次交流,若雙方感覺良好,再安排真實(shí)見面。綜上所述,智能體在未來(lái)將有一系列新發(fā)展,智能分身的應(yīng)用便是其中的重要一環(huán)。
關(guān)于如何將AI與中國(guó)產(chǎn)能相結(jié)合,我們國(guó)家擁有幾個(gè)明顯的優(yōu)勢(shì)領(lǐng)域。首先,中國(guó)擁有世界上最為完整和先進(jìn)的智能制造產(chǎn)業(yè)鏈,特別是在中低端智能制造方面;其次,中國(guó)在短視頻、直播帶貨、短劇及移動(dòng)游戲等方面,同樣保持世界領(lǐng)先地位。為了發(fā)揮這些優(yōu)勢(shì),我們計(jì)劃將AI技術(shù)與這些領(lǐng)先全球的行業(yè)深度融合。
在產(chǎn)業(yè)應(yīng)用上,大飛機(jī)可謂人類制造的最復(fù)雜工業(yè)品,擁有高達(dá)200萬(wàn)個(gè)零件。那么,借助AI的力量,我們是否有能力造出零件數(shù)量達(dá)千萬(wàn)級(jí)的工業(yè)品?這無(wú)疑是一個(gè)巨大挑戰(zhàn)。在服裝領(lǐng)域,我們的目標(biāo)是在今年穿上由服裝大模型設(shè)計(jì)的AI服裝;在教育領(lǐng)域,我們提出了從“多能”到“超能”的轉(zhuǎn)變,注重培養(yǎng)學(xué)生對(duì)于AI應(yīng)用的綜合能力,等等。
經(jīng)過(guò)深入分析,我們得出一個(gè)基本結(jié)論:在未來(lái)十年內(nèi),手機(jī)仍將保持其主流交互和計(jì)算設(shè)備的地位,但隨著技術(shù)不斷進(jìn)步,AR眼鏡和頭盔等設(shè)備有可能在未來(lái)十年之后逐漸取代手機(jī)的主導(dǎo)地位。在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,短視頻已經(jīng)成為主要內(nèi)容消費(fèi)形式,并正逐漸演變?yōu)锳I短視頻。對(duì)于非內(nèi)容操作方面,AI助手將成為主導(dǎo),預(yù)計(jì)每個(gè)人都將擁有自己的AI助手。清華大學(xué)已宣布2024年下半年新生開學(xué)時(shí),每位新生將配備一個(gè)AI助手,并且開設(shè)了一百多門AI授課課程,充分展示了AI與實(shí)踐的緊密結(jié)合。
AI發(fā)展仍有短板
關(guān)于AI的短板,盡管人們要多談及其優(yōu)勢(shì),然而AI幻覺仍是一大問(wèn)題。以我個(gè)人經(jīng)歷為例,我曾嘗試將我與我愛人19歲時(shí)的照片進(jìn)行AI合成。結(jié)果有的畫面我愛人多出一只手,而搭在我肩上的手竟有六根手指,這便是AI在繪制多個(gè)物體時(shí)可能出現(xiàn)的錯(cuò)誤。然而,當(dāng)我們向AI提出具體要求時(shí),如“請(qǐng)將臉部和手部表現(xiàn)得更清晰”,由于AI具備注意力機(jī)制,它在繪制手部時(shí)會(huì)更為專注,從而減少出錯(cuò)的可能。這樣,AI在繪制其他部分時(shí)可能不必投入過(guò)多算力,從而提高整體準(zhǔn)確性。
在與AI的對(duì)話中,我們可以發(fā)現(xiàn),盡管AI具有強(qiáng)大的能力,但也存在其局限性。有時(shí)AI給出的答案并不能令我們十分滿意。因此,在與AI交流時(shí),我們需要提出更具挑戰(zhàn)性的問(wèn)題,利用AI去嘗試完成那些以前人類難以完成的任務(wù),這才是我們真正需要的。
隨著技術(shù)優(yōu)化和進(jìn)步,AI現(xiàn)在繪圖出現(xiàn)六個(gè)手指頭的幻覺率已顯著下降至10%至20%,這體現(xiàn)了我們?cè)谌斯ぶ悄茴I(lǐng)域研究的顯著進(jìn)步。但對(duì)于容錯(cuò)率較高的行業(yè),如科幻類電影制作,AI技術(shù)的運(yùn)用可以更為大膽,因?yàn)榧词钩霈F(xiàn)一些瑕疵,觀眾也不會(huì)斤斤計(jì)較。然而,對(duì)于容錯(cuò)率較低的行業(yè),如嚴(yán)格的醫(yī)療系統(tǒng),AI的應(yīng)用就需要更為謹(jǐn)慎,以免出現(xiàn)不可挽回的失誤。
綜上所述,盡管當(dāng)前的AI技術(shù)已經(jīng)能夠?qū)崿F(xiàn)許多人類難以完成的功能,但人工智能研究公司OpenAI正式對(duì)外發(fā)布的人工智能“文生視頻”大模型Sora仍然存在一些亟待解決的問(wèn)題。首先,其物理模擬的準(zhǔn)確性有待提高;其次,Sora在處理空間關(guān)系時(shí)存在混淆現(xiàn)象;最后,其對(duì)于多角色交互的理解也面臨挑戰(zhàn)。這些問(wèn)題的存在,使得我們對(duì)Sora1.0版本的評(píng)估分?jǐn)?shù)為70—80分,表明其仍有待完善。這同樣也為創(chuàng)作者提供了廣闊的空間和潛力。我們期待在未來(lái)的版本中看到Sora的進(jìn)一步改進(jìn)和優(yōu)化。
?。ㄗ髡呱蜿?yáng)系清華大學(xué)新聞與傳播學(xué)院教授,新媒體研究中心主任,跨學(xué)科知名學(xué)者)
