科大訊飛的人工智能之路
- 來(lái)源:互聯(lián)網(wǎng)經(jīng)濟(jì) smarty:if $article.tag?>
- 關(guān)鍵字:科大訊飛,人工智能 smarty:/if?>
- 發(fā)布時(shí)間:2017-01-11 10:59
科大訊飛作為中國(guó)在人工智能方面的領(lǐng)頭羊企業(yè),主要發(fā)展語(yǔ)音識(shí)別技術(shù),當(dāng)前人工智能已經(jīng)成為風(fēng)口,科大訊飛專注技術(shù)實(shí)力的開(kāi)發(fā),正蓄勢(shì)待飛。
站上人工智能產(chǎn)業(yè)的制高點(diǎn)
今年,李世石與Alpha Go的人機(jī)圍棋大戰(zhàn)吸睛無(wú)數(shù),人工智能的話題始料未及地席卷了世界每處。今年也恰逢人工智能學(xué)科誕生一甲子,歷經(jīng)波折的人工智能發(fā)展終于掀起全球熱潮,各國(guó)政府紛紛提出人工智能發(fā)展研究相關(guān)計(jì)劃,蘋(píng)果、谷歌等國(guó)際IT產(chǎn)業(yè)巨頭也相繼推出一系列人工智能應(yīng)用,希望在新一輪人工智能技術(shù)競(jìng)爭(zhēng)中取得先機(jī)。
科大訊飛作為亞太地區(qū)最大的智能語(yǔ)音和人工智能上市公司,也是中國(guó)智能語(yǔ)音與人工智能產(chǎn)業(yè)的領(lǐng)導(dǎo)者,在語(yǔ)音合成、語(yǔ)音識(shí)別、口語(yǔ)評(píng)測(cè)、自然語(yǔ)言處理等多項(xiàng)技術(shù)上擁有國(guó)際領(lǐng)先成果。目前,科大訊飛已經(jīng)占有中文語(yǔ)音技術(shù)市場(chǎng)70%以上的市場(chǎng)份額。
在人工智能技術(shù)鉆研與產(chǎn)業(yè)布局上,科大訊飛也較早提出了明確的思路與方向。2014年,“訊飛超腦”計(jì)劃應(yīng)運(yùn)而生,目標(biāo)是讓機(jī)器實(shí)現(xiàn)從“能聽(tīng)會(huì)說(shuō)”到“能理解會(huì)思考”;2015年,科大訊飛發(fā)布的具有里程碑意義的人機(jī)交互界面AIUI現(xiàn)在聚合了超過(guò)18萬(wàn)的開(kāi)發(fā)伙伴和8億的終端用戶,以科大訊飛為中心的人工智能產(chǎn)業(yè)生態(tài)已經(jīng)逐步構(gòu)建??拼笥嶏w力求在人工智能時(shí)代真正到來(lái)時(shí)全面開(kāi)花,搶占人工智能產(chǎn)業(yè)高點(diǎn)。
科大訊飛是如何發(fā)展的?
科大訊飛是一家典型的創(chuàng)業(yè)公司,身上還有一個(gè)特殊的標(biāo)簽:中國(guó)在校大學(xué)生創(chuàng)業(yè)的第一家上市公司。
1999年,還在中國(guó)科學(xué)技術(shù)大學(xué)就讀的劉慶峰面對(duì)當(dāng)時(shí)中文語(yǔ)音市場(chǎng)由國(guó)際巨頭把持的現(xiàn)狀,懷揣“中文語(yǔ)音技術(shù)必須由中國(guó)人做到全球最好,中文語(yǔ)音產(chǎn)業(yè)必須掌握在自己手上”的信念,毅然創(chuàng)立了科大訊飛。
從6個(gè)人的團(tuán)隊(duì)到后來(lái)18個(gè)人創(chuàng)業(yè),一度并沒(méi)有人相信這個(gè)“草臺(tái)班子”能夠與國(guó)際巨頭抗衡。初期的科大訊飛遭逢創(chuàng)業(yè)的種種艱難,直至5年后,公司才終于實(shí)現(xiàn)盈虧平衡。在盈利的博弈與權(quán)衡中,語(yǔ)音技術(shù)與產(chǎn)業(yè)當(dāng)時(shí)被牢牢確立為公司的發(fā)展目標(biāo)和方向。巨大的壓力之下,磨礪出的是堅(jiān)持創(chuàng)新和堅(jiān)忍不拔的寶貴品質(zhì),這也成為科大訊飛一貫堅(jiān)守和傳承的核心精神。
創(chuàng)立近10年后,科大訊飛迎來(lái)了一個(gè)發(fā)展拐點(diǎn)—上市。2008年的中國(guó)風(fēng)云變幻,科大訊飛上市猶如浪潮中的一簇小水花,卻激起了自身的滔天巨浪。技術(shù)仍然是核心,產(chǎn)品和市場(chǎng)意識(shí)逐漸走上舞臺(tái)。劉慶峰帶領(lǐng)團(tuán)隊(duì)進(jìn)一步梳理了公司的愿景和使命,立志要讓事業(yè)影響中國(guó)未來(lái),影響到每一個(gè)普通人的生活中。
功夫不負(fù)有心人。憑借核心技術(shù)的絕對(duì)優(yōu)勢(shì),科大訊飛在歷次的國(guó)內(nèi)外語(yǔ)音合成評(píng)測(cè)中,各項(xiàng)關(guān)鍵指標(biāo)均名列第一,2008年至今連續(xù)在國(guó)際語(yǔ)種識(shí)別評(píng)測(cè)大賽中名列前茅,2003年和2011年兩次榮獲“國(guó)家科技進(jìn)步獎(jiǎng)”,2005年和2011年兩次獲得中國(guó)信息產(chǎn)業(yè)自主創(chuàng)新最高榮譽(yù)“信息產(chǎn)業(yè)重大技術(shù)發(fā)明獎(jiǎng)”。
2010年,科大訊飛發(fā)布了語(yǔ)音云平臺(tái)和輸入法,云平臺(tái)面向所有創(chuàng)業(yè)者免費(fèi)開(kāi)放,為海量用戶提供服務(wù)。數(shù)據(jù)的抓取、資源的整合,顯示的是科大訊飛決策未來(lái)的戰(zhàn)略決心。在此基礎(chǔ)上,隨著人工智能時(shí)代的來(lái)臨,科大訊飛連續(xù)發(fā)力:2014年發(fā)布“訊飛超腦”計(jì)劃,核心就是讓機(jī)器從“能聽(tīng)會(huì)說(shuō)”到“能理解會(huì)思考”;2015年發(fā)布對(duì)人工智能產(chǎn)業(yè)具有里程碑意義的人機(jī)交互界面—AIUI。在教育、家居、客服、車載、醫(yī)療等細(xì)分領(lǐng)域,科大訊飛依托人工智能技術(shù)達(dá)成廣泛合作,推出品類豐富的產(chǎn)品體系覆蓋市場(chǎng)。
2016年5月,Research Markets最新發(fā)布的報(bào)告稱在全球語(yǔ)音市場(chǎng),谷歌、微軟、蘋(píng)果和科大訊飛獲得了迅速增長(zhǎng),全球市場(chǎng)份額分別為20.7%、13.4%、12.9%和6.7%,科大訊飛已經(jīng)代表中國(guó)民族創(chuàng)新企業(yè)站上了國(guó)際舞臺(tái),在全球競(jìng)爭(zhēng)中占據(jù)一席之地。
“訊飛超腦”布局
美國(guó)、歐盟等發(fā)達(dá)國(guó)家分別提出了“Brain Initiative”和“Human Brain Project”等人腦研究計(jì)劃,投入巨資并將其提升到與“人類基因圖譜”重大工程并重的高度。蘋(píng)果、谷歌等國(guó)際IT產(chǎn)業(yè)巨頭亦相繼推出了Siri、Google Now語(yǔ)音搜索等一系列人工智能應(yīng)用。全球政府、企業(yè)都已將目光投向人工智能行業(yè),各顯神通。
人工智能的突破與“認(rèn)知革命”緊密相關(guān)。七萬(wàn)年前,人類發(fā)生了“認(rèn)知革命”,核心是智人擁有豐富的語(yǔ)言,可以更好地描述自然世界、執(zhí)行更加復(fù)雜的計(jì)劃,關(guān)鍵是可以描述夢(mèng)中和想象的東西,從而產(chǎn)生虛構(gòu)、宗教和各種概念。正因如此,目前很多正在做人工智能研究的專家,包括Michael Jordan和Yann Lecun等都已經(jīng)意識(shí)到,自然語(yǔ)言理解對(duì)于人工智能來(lái)說(shuō)是一個(gè)突破口。
科大訊飛目前正在執(zhí)行的“訊飛超腦計(jì)劃”,就是希望實(shí)現(xiàn)包括感知智能和認(rèn)知智能在內(nèi)的全面突破,也是在人工智能領(lǐng)域的核心布局內(nèi)容。在感知智能領(lǐng)域,語(yǔ)音識(shí)別、手寫(xiě)識(shí)別方面每年保證30%-50%的錯(cuò)誤率的下降;在識(shí)別普通話的基礎(chǔ)之上,進(jìn)一步識(shí)別方言;不僅能夠理解人類和機(jī)器的對(duì)話,還能理解人和人之間的對(duì)話;不僅能夠識(shí)別聯(lián)機(jī)手寫(xiě)的字符,還能識(shí)別離線手寫(xiě)的字符。在認(rèn)知智能上的研究目標(biāo),關(guān)鍵是讓機(jī)器能理解會(huì)思考,這必須要突破語(yǔ)言理解、知識(shí)表示、聯(lián)想推理、自主學(xué)習(xí)等多個(gè)方面。
目前,科大訊飛的“訊飛超腦”已取得了階段性的進(jìn)展。作為計(jì)劃的重要組成部分,科大訊飛正牽頭進(jìn)行科技部863重大專項(xiàng)—“類人答題機(jī)器人項(xiàng)目”,未來(lái)要讓機(jī)器人參加高考并考上一本,甚至是清華、北大、科大這樣水平的高校。而在口語(yǔ)翻譯和評(píng)測(cè)方面,目前科大訊飛口語(yǔ)翻譯技術(shù)已達(dá)到英語(yǔ)六級(jí)水平,在國(guó)際機(jī)器翻譯評(píng)測(cè)(IWSLT2014,NIST2015)等大賽中奪得冠軍,口語(yǔ)作文評(píng)測(cè)機(jī)器已可替代老師進(jìn)行自動(dòng)評(píng)測(cè),在廣東高考英語(yǔ)口語(yǔ)作文考試中得以全面應(yīng)用。在主觀題閱卷上,科大訊飛將業(yè)界獨(dú)家的人工智能核心技術(shù)應(yīng)用于考試以及傳統(tǒng)線下作業(yè)的自動(dòng)批閱,不論是手寫(xiě)識(shí)別的還是選擇題涂抹,都可以先通過(guò)OCR轉(zhuǎn)變成計(jì)算機(jī)可以理解的文本和圖像,再讓計(jì)算機(jī)自動(dòng)對(duì)答案的正確程度進(jìn)行評(píng)判,這其實(shí)是感知智能和認(rèn)知智能的結(jié)合?,F(xiàn)在安徽省合肥市和安慶市的會(huì)考中,英文和中文的考試已經(jīng)全部使用了整套感知智能和認(rèn)知智能技術(shù)進(jìn)行自動(dòng)評(píng)分,取得了非常好的效果,以后此技術(shù)將會(huì)被全面推廣到包括文科和理科的所有課程。
在產(chǎn)品應(yīng)用之外,基于多年積累,目前科大訊飛在各項(xiàng)大賽中都取得了優(yōu)異的成果。以今年為例,在年初舉行的國(guó)際語(yǔ)音合成大賽上,科大訊飛通過(guò)承建的語(yǔ)音及語(yǔ)言信息處理國(guó)家工程實(shí)驗(yàn)室報(bào)送的參賽系統(tǒng),不僅繼續(xù)在自然度、相似度、可懂度等傳統(tǒng)指標(biāo)上保持國(guó)際領(lǐng)先,還在語(yǔ)篇段落表現(xiàn)測(cè)試中所有7項(xiàng)測(cè)試指標(biāo)位列第一。這是科大訊飛自2006年首次參賽以來(lái),第十一次參與該項(xiàng)賽事,持續(xù)鞏固了在智能語(yǔ)音技術(shù)的全球領(lǐng)先地位。
隨后,在今年的全球人工智能比賽Winograd Schema Challenge中,科大訊飛再次榮獲第一。Winograd Schema Challenge作為意圖取代圖靈測(cè)試(Turing test)的人工智能測(cè)試項(xiàng)目,著重考察認(rèn)知、推理和常識(shí)判斷能力。
此外在美國(guó)當(dāng)?shù)貢r(shí)間9月13日,科大訊飛領(lǐng)銜的中國(guó)技術(shù)團(tuán)隊(duì)又在國(guó)際多通道語(yǔ)音分離和識(shí)別大賽(CHiME)中包攬了賽事全部三個(gè)項(xiàng)目的冠軍。據(jù)介紹,CHiME比賽重點(diǎn)解決的是真實(shí)、復(fù)雜場(chǎng)景下的語(yǔ)音識(shí)別,因此是語(yǔ)音識(shí)別領(lǐng)域最高難度的比賽之一。參賽的各個(gè)語(yǔ)音系統(tǒng)需要克服高噪聲、混響等干擾,在咖啡廳、公交車、街道等日常生活場(chǎng)景中,準(zhǔn)確地識(shí)別和處理英文語(yǔ)音。
以各項(xiàng)賽事成績(jī)名列前茅的技術(shù)為保障,“訊飛超腦計(jì)劃”的目標(biāo)就是讓各類智能終端實(shí)現(xiàn)從“能聽(tīng)會(huì)說(shuō)”到“能理解會(huì)思考”的演進(jìn),進(jìn)而實(shí)現(xiàn)全球第一個(gè)中文認(rèn)知智能計(jì)算引擎,在語(yǔ)音合成、識(shí)別和人工智能等各項(xiàng)領(lǐng)域引領(lǐng)智能應(yīng)用潮流的發(fā)展。
風(fēng)雨過(guò)后見(jiàn)彩虹
雖然人工智能現(xiàn)在已經(jīng)大熱,但對(duì)于這個(gè)行業(yè)將來(lái)在技術(shù)和產(chǎn)品等方面的具體發(fā)展前景,學(xué)界與業(yè)界也有諸多討論。
在科大訊飛輪值總裁、訊飛研究院院長(zhǎng)胡郁看來(lái),大家普遍更為關(guān)心的是人工智能的突破問(wèn)題。目前,深度神經(jīng)網(wǎng)絡(luò)與大數(shù)據(jù)兩個(gè)關(guān)鍵要素的結(jié)合是當(dāng)前人工智能研究的一條主流路徑,這條路徑中還有一個(gè)非常重要的內(nèi)容,就是基于互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的“研究-工程-產(chǎn)品-用戶”大閉環(huán)優(yōu)化,用簡(jiǎn)單的四個(gè)字概括就是“大、智、移、云”,它推動(dòng)了工業(yè)界人工智能技術(shù)直接邁過(guò)了可用性門(mén)檻。
現(xiàn)在工業(yè)界所依賴的大閉環(huán)優(yōu)化、深度學(xué)習(xí)和大數(shù)據(jù),跟腦科學(xué)的研究思路結(jié)合也是完全有可能的。因?yàn)楝F(xiàn)在人工智能網(wǎng)絡(luò)借助于新的學(xué)習(xí)機(jī)理甚至拓?fù)浣Y(jié)構(gòu)上的改進(jìn),將可以進(jìn)一步成為人工智能發(fā)展強(qiáng)有力的推動(dòng)力。漣漪效應(yīng)、深度學(xué)習(xí)和大數(shù)據(jù)的結(jié)合成為目前推動(dòng)人工智能向前發(fā)展的最有效的路徑。
技術(shù)的突破從源頭上推動(dòng)了人工智能產(chǎn)業(yè)的發(fā)展,而人工智能產(chǎn)業(yè)的發(fā)展又帶來(lái)了嶄新的問(wèn)題:人工智能是否會(huì)威脅人類,搶人類的飯碗?胡郁認(rèn)為,現(xiàn)在的人工智能跟我們的意識(shí)其實(shí)沒(méi)有任何的關(guān)系,所以機(jī)器的發(fā)展將來(lái)不會(huì)殘害人類或者替代人類,反而會(huì)讓我們的生活更加輕松和便捷。此前科大訊飛董事長(zhǎng)劉慶峰曾在今年參與G20峰會(huì)下的B20會(huì)議接受《人民日?qǐng)?bào)》采訪時(shí)表示,人工智能將會(huì)使社會(huì)的生產(chǎn)效率大幅度提升,社會(huì)財(cái)富創(chuàng)造的數(shù)量和質(zhì)量呈指數(shù)級(jí)別增長(zhǎng);同時(shí)人工智能也將替代掉大部分的現(xiàn)有勞動(dòng)力,顛覆現(xiàn)在的很多產(chǎn)業(yè)。這既是我們今天面臨的巨大機(jī)遇,也是巨大挑戰(zhàn)。
總體來(lái)看,未來(lái)十年將會(huì)是人工智能發(fā)展的關(guān)鍵階段,在這一行業(yè)中,中國(guó)現(xiàn)在少有的兼具核心技術(shù)能力和產(chǎn)業(yè)基礎(chǔ)條件:在國(guó)家層面,2014年科技部“863 計(jì)劃”啟動(dòng)“基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)”項(xiàng)目;在企業(yè)層面,以科大訊飛為代表的中國(guó)自主創(chuàng)新企業(yè)已經(jīng)找到人工智能發(fā)展的必由之路—從語(yǔ)音和語(yǔ)音為入口介入認(rèn)知智能。因此未來(lái)中國(guó)在人工智能行業(yè)和人工智能產(chǎn)業(yè)上必將大有可為。
且行且珍惜
一項(xiàng)技術(shù)從產(chǎn)生到發(fā)展到產(chǎn)業(yè)化再到消亡需要經(jīng)歷很多過(guò)程,很多技術(shù)就在經(jīng)歷了這樣的過(guò)程后慢慢消失了,而有些又被新的技術(shù)代替了。人工智能作為一個(gè)寬泛的概念,包含了語(yǔ)音、圖像、語(yǔ)義理解等許多方面,因此在他的發(fā)展道路上必然會(huì)出現(xiàn)很多的困境和曲折。
首先就是產(chǎn)業(yè)化的問(wèn)題。技術(shù)向產(chǎn)品的轉(zhuǎn)化是技術(shù)持續(xù)發(fā)展的不竭動(dòng)力。而就產(chǎn)品而言,實(shí)用性是消費(fèi)者追求和喜愛(ài)的第一要義。如果現(xiàn)在的人工智能像此前的技術(shù)浪潮一樣僅僅止步于概念上的聯(lián)網(wǎng),或者只是停留在實(shí)驗(yàn)室和研發(fā)中心中,那么缺乏了產(chǎn)業(yè)化和商品化的技術(shù)就會(huì)像是無(wú)本之木、無(wú)源之水,最終還會(huì)走向末路和枯竭。此前科大訊飛董事長(zhǎng)劉慶峰在今年全國(guó)兩會(huì)中提出要將人工智能確立為國(guó)家戰(zhàn)略,從國(guó)家的層面發(fā)展人工智能產(chǎn)業(yè)正是充分考慮到了人工智能發(fā)展的產(chǎn)業(yè)化問(wèn)題,希望在國(guó)家的扶持下形成兼顧競(jìng)爭(zhēng)力和消費(fèi)者口碑的人工智能產(chǎn)品。目前人工智能正處在商業(yè)模式構(gòu)建和產(chǎn)業(yè)雛形生成的階段,以科大訊飛為主體的“中國(guó)聲谷”產(chǎn)業(yè)園區(qū)也在安徽省和合肥市的大力支持下逐步成長(zhǎng),逐步向產(chǎn)業(yè)特色鮮明、產(chǎn)業(yè)集群優(yōu)勢(shì)突出、產(chǎn)業(yè)規(guī)模和影響力處于國(guó)際前列的階段穩(wěn)步邁進(jìn)。
其次,就是入口的問(wèn)題。人工智能作為具有一定前瞻性的技術(shù),在發(fā)展的過(guò)程中需要尋求一個(gè)合適的切入口融入大眾的生活。未來(lái)是一個(gè)萬(wàn)物互聯(lián)的時(shí)代,面對(duì)各式各樣連入互聯(lián)網(wǎng)的智能硬件和其他設(shè)備,用戶都需要有更方便的手段進(jìn)行操控。而這一切都將是語(yǔ)音大顯身手的時(shí)刻。正如前文所述,目前科大訊飛通過(guò)多年的技術(shù)積累,借助遠(yuǎn)場(chǎng)識(shí)別、麥克風(fēng)陣列、自然語(yǔ)言理解等技術(shù),在多項(xiàng)智能語(yǔ)音和語(yǔ)言理解測(cè)試中榮獲桂冠。目前的技術(shù)已經(jīng)具有了實(shí)用的能力和推廣的可能性,因此在未來(lái)借助語(yǔ)音的入口,實(shí)現(xiàn)人工智能的突破和跨越是非常有希望和前景的。
緊接著產(chǎn)業(yè)化和產(chǎn)品而來(lái)的就是盈利的問(wèn)題。就人工智能產(chǎn)業(yè)來(lái)說(shuō),目前還處在初始投入階段,離盈利還有一定距離。但是只要占據(jù)了市場(chǎng)和用戶占有率,盈利其實(shí)也就近在眼前。以個(gè)人用戶和隨身可穿戴設(shè)備為例,借助認(rèn)知計(jì)算引擎和語(yǔ)音識(shí)別功能,目前所有的移動(dòng)互聯(lián)網(wǎng)模式,都可以在語(yǔ)音交互的過(guò)程中得以實(shí)現(xiàn)。人們通過(guò)在隨身設(shè)備上實(shí)現(xiàn)基于語(yǔ)音交互的各項(xiàng)功能,可以獲得所需要的各項(xiàng)功能,而企業(yè)在這一交互過(guò)程中則可以獲得海量的后臺(tái)大數(shù)據(jù),還可以實(shí)時(shí)推送相關(guān)信息;而以商業(yè)用戶為例,為了獲取需要的技術(shù)保障和增值服務(wù),用戶將會(huì)選擇付費(fèi)的相關(guān)服務(wù),這其中的市場(chǎng)規(guī)模都可以說(shuō)是難以估量的。
最后,就是許多企業(yè)都會(huì)遇到的資本問(wèn)題。其實(shí)并不是所有的企業(yè)和行業(yè)都適合資本的進(jìn)入和并購(gòu)的展開(kāi),此前劉慶峰曾提出,在人工智能行業(yè),以科大訊飛為代表的中國(guó)企業(yè)真正的競(jìng)爭(zhēng)對(duì)手是國(guó)際上的人工智能巨頭,因此應(yīng)當(dāng)學(xué)習(xí)華為的作風(fēng),將工作和精力的重心放在技術(shù)研發(fā)和創(chuàng)新上。
數(shù)百年前的萬(wàn)戶,不會(huì)想到現(xiàn)在NASA已經(jīng)成功將人類送出地球,遠(yuǎn)航太空;百年前的萊特兄弟,不會(huì)想到如今的客機(jī)已經(jīng)可以運(yùn)載相比當(dāng)年幾何倍數(shù)的乘客跨越五大洲四大洋。無(wú)論愿不愿意、無(wú)論是否承認(rèn),科技進(jìn)步的速度,總是超乎最前衛(wèi)的理想主義者的想象。隨著技術(shù)的發(fā)展,人工智能未來(lái)將在智能硬件、車聯(lián)網(wǎng)、機(jī)器人、自動(dòng)客服、教育等方面發(fā)揮越來(lái)越顯著的作用。而科大訊飛作為亞太地區(qū)最大的智能語(yǔ)音和人工智能領(lǐng)導(dǎo)者,以多年潛心耕耘智能語(yǔ)音和人工智能技術(shù)的底蘊(yùn),必將堅(jiān)守“用人工智能建設(shè)美好世界”的口號(hào),和大家共同見(jiàn)證人工智能時(shí)代的真正到來(lái)。
文/衛(wèi)萌 淦凌云
