語音識別、文本識別、視頻識別……數(shù)字經(jīng)濟時代,人工智能技術(shù)已走近你我身邊,被視為經(jīng)濟增長的新引擎、國際競爭的新陣地和推動智慧社會建設(shè)的有效工具。而加快“人工智能+”產(chǎn)業(yè)融合、賦能更多行業(yè)應(yīng)用落地,更成為社會各界共同的期待。
然而,不久前在由中國人工智能學(xué)會主辦的2020中國人工智能產(chǎn)業(yè)年會上,最新發(fā)布的報告指出,目前已成熟應(yīng)用的人工智能技術(shù)僅為語音識別,機器學(xué)習(xí)、計算機視覺、自然語言處理、知識圖譜、智能機器人等技術(shù)距離生長成熟尚需數(shù)年時間,而無人駕駛汽車在未來10年內(nèi)都不太可能出現(xiàn)。
從實驗室走向大規(guī)模商用,人工智能還需要多久?尚存在哪些“堵點”“痛點”?在許多業(yè)內(nèi)專家看來,正視人工智能尚存在的諸多挑戰(zhàn),對技術(shù)賦能抱有理性期待,方能讓其回歸技術(shù)本質(zhì),成為更多產(chǎn)業(yè)變革創(chuàng)新的動力源泉。
算法不透明導(dǎo)致的不可解釋
2016年,谷歌人工智能系統(tǒng)AlphaGo擊敗世界圍棋冠軍李世石,令世人大為震動。依靠人工智能深度學(xué)習(xí)理論的突破,計算機可以模仿人類作出決策,然而,這僅基于大量的數(shù)據(jù)學(xué)習(xí),而非因果或規(guī)則推理,整個決策過程仍是一個“黑箱”,人類難以理解,導(dǎo)致追責(zé)難。
復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院院長姜育剛舉例,此前,美國IBM公司研發(fā)了人工智能系統(tǒng)“沃森”幫助醫(yī)生進(jìn)行診療決策。然而,許多醫(yī)生很快發(fā)現(xiàn)在使用“沃森”時,系統(tǒng)給出了多個不安全、不正確的治療意見,甚至在極端的診斷案例中,“沃森”給有出血癥狀的癌癥病人開出了容易導(dǎo)致出血的藥物,嚴(yán)重時可致患者死亡。然而,醫(yī)生卻并不知道為什么“沃森”給出了這樣的意見。決策步驟的不可解釋,帶來諸多不確定性。
近年來,人工智能應(yīng)用于新藥研發(fā)被寄予厚望。然而,算法的不可解釋性卻橫亙在前。相關(guān)研發(fā)和監(jiān)管部門需要清楚地知道藥物開發(fā)中使用的算法,從而理解人工智能主導(dǎo)的決策背后的邏輯。如果不對監(jiān)管實現(xiàn)算法透明化,人工智能將會是一個無法進(jìn)行嚴(yán)謹(jǐn)?shù)目茖W(xué)評價及驗證的“黑匣子”。這可能會導(dǎo)致在藥物審批過程中出現(xiàn)種種無法預(yù)料的問題,比如對人工智能“發(fā)現(xiàn)”的生物標(biāo)記物的接受度不明。此外,對于智能政務(wù)、無人駕駛這樣安全性要求極高的行業(yè),人工智能的引入自然更為謹(jǐn)慎。
“深度學(xué)習(xí)的算法和核心模型需要能夠真正展開,讓公眾知曉它的機理模型”,上海人工智能研究院有限公司總經(jīng)理宋海濤建議。中科院軟件研究所研究員薛云志則指出,人工智能面向不同知識背景的用戶,要能以簡單、清晰的方式,對決策過程的根據(jù)和原因進(jìn)行說明,并能對系統(tǒng)決策過程關(guān)鍵節(jié)點的數(shù)據(jù)加以追溯并能夠?qū)徲?,這在未來人工智能應(yīng)用大規(guī)模落地時,是特別需要關(guān)注的特性,也是實施監(jiān)管的必要。
易受欺騙引發(fā)安全性質(zhì)疑
作為人工智能技術(shù)的“大熱選手”,深度學(xué)習(xí)可以通過對大量已知樣本的訓(xùn)練,制作自己的樣本,這是深度學(xué)習(xí)的特點,同樣也是痛點。
京東人工智能研究院院長周伯文坦言,人工智能目前在面向產(chǎn)業(yè)化落地時,遇到的巨大挑戰(zhàn)正是真實環(huán)境的開放邊界和規(guī)則模糊,數(shù)據(jù)的“噪音”非常多,使得智能模型的部分結(jié)果和使用情況難以讓人信賴。
姜育剛指出,人工智能目前的智能判別模式存在缺陷,容易被對抗樣本所欺騙。比如圖像識別,在一張人像圖片上加入一些非常少量的干擾,人為視覺看上去基本沒有區(qū)別,但人工智能模型就會產(chǎn)生識別錯誤;再如自動駕駛,一張“限速80碼”的交通標(biāo)牌,加入一些干擾后,就可能被機器識別成“禁止通行”。顯然,存在很大的安全隱患。
語音識別領(lǐng)域也存在這種問題。技術(shù)人員在語音上任意加入非常微小的干擾,語音識別系統(tǒng)就可能會識別錯誤。同樣,在文本識別領(lǐng)域,改變一個字母就可以使得文本內(nèi)容被錯誤分類。
此外,若深度學(xué)習(xí)的數(shù)據(jù)集中存在隱藏的偏見,人工智能系統(tǒng)無法發(fā)現(xiàn),也不會否定。缺少反饋機制的“照單全收”,最終可能導(dǎo)致生成的結(jié)果并不客觀。
例如在行業(yè)內(nèi)已經(jīng)出現(xiàn)的,人工智能在深度學(xué)習(xí)后對女性、少數(shù)族裔、非主流文化群體產(chǎn)生“歧視”:亞馬遜通過人工智能篩選簡歷,卻發(fā)現(xiàn)了系統(tǒng)對女性存在偏見導(dǎo)致最終關(guān)閉。更為常見的是手機軟件利用人工智能算法導(dǎo)致的大數(shù)據(jù)“殺熟”,如根據(jù)手機類型的不同,可能會推薦不同類型的商品,甚至打車時推薦不同價格、檔次的車輛。
目前,“AI+金融”的發(fā)展如火如荼。但當(dāng)金融機構(gòu)均采用人工智能進(jìn)行決策時,其市場信號解讀就可能趨同與不斷強化,導(dǎo)致形成偏離正常市場規(guī)律的結(jié)果。而這些不正常的市場變化也會成為人工智能的學(xué)習(xí)基礎(chǔ),將人工智能的決策邏輯進(jìn)一步畸化,容易造成惡劣的后果。
以上這些問題,影響著人工智能賦能實體經(jīng)濟的安全性,凸顯產(chǎn)業(yè)對技術(shù)可信賴性的呼喚。“從AI到可信賴AI,意味著我們需要在技術(shù)層面上解決魯棒性(穩(wěn)定性)、可解釋性和可復(fù)制性這些核心技術(shù)挑戰(zhàn)。同時為了大規(guī)模產(chǎn)業(yè)化應(yīng)用,我們必須考慮到人工智能的公平性和負(fù)責(zé)任。這幾個維度是人工智能必須要解決的問題。”周伯文說。
法律規(guī)制和倫理問題待完善
“目前的智能算法還存在給出的決策不符合倫理道德要求的問題。”姜育剛指出,在應(yīng)用中已發(fā)現(xiàn),智能算法的決策沒有從改善人類生活、服務(wù)人類社會的角度來進(jìn)行。如智能音響在對話中出現(xiàn)“勸主人自殺”的內(nèi)容,聊天機器人學(xué)會了罵臟話和種族歧視等。而這些不友好的決策都是模型從數(shù)據(jù)中學(xué)來的,并不是研發(fā)者對人工智能模型設(shè)置的目標(biāo)。
同時,人工智能算法需要海量的數(shù)據(jù)驅(qū)動,訓(xùn)練數(shù)據(jù)可以被算法恢復(fù),個人隱私存在泄露和被侵犯的風(fēng)險,而大量的數(shù)據(jù)也存在共享壁壘。在人工智能賦能金融的過程中,這一問題尤被關(guān)注。最新報告顯示,近年來,每年發(fā)生金融隱私泄露事件以大約35%的速度在增長。加之近年來人工智能技術(shù)在金融行業(yè)的廣泛應(yīng)用,由此帶來的銀行數(shù)據(jù)、保險數(shù)據(jù)、網(wǎng)貸業(yè)務(wù)及大數(shù)據(jù)等個人信息保護問題日益凸顯。
在2020年抗擊新冠肺炎疫情期間,人工智能技術(shù)在我國響應(yīng)速度快、介入力度大,幫助推出了CT影像的輔助診斷系統(tǒng),提升了醫(yī)生診斷的速度和信心。然而,醫(yī)療影像智能診斷發(fā)展也面臨著法律規(guī)制問題。與其他人工智能賦能行業(yè)的大數(shù)據(jù)相比,獲取高質(zhì)量的醫(yī)療影像數(shù)據(jù)相對困難。不同醫(yī)療機構(gòu)的數(shù)據(jù),目前還很少互通、共享。而單個醫(yī)療機構(gòu)積累的數(shù)據(jù)往往不足以訓(xùn)練出有效的深度學(xué)習(xí)模型。此外,使用醫(yī)療影像數(shù)據(jù)進(jìn)行人工智能算法的訓(xùn)練還涉及保護病人隱私等非技術(shù)問題。
此外,近年來,隨著人工智能技術(shù)的深入探索,科學(xué)界有人提出研發(fā)“人工生命”,成為又一個倫理話題。對此,中國工程院院士李德毅表示,生命不僅有智能,更要有意識。從倫理角度上,生命是人類的底線,觸碰底線要慎之又慎。“所以,我們可以通過計算機技術(shù)繼續(xù)研發(fā)沒有意識、但有智能的高階機器。讓人類的智能在體外延伸,保持它的工具性,而非人工創(chuàng)造意識。”
深圳云天勵飛技術(shù)股份有限公司副總裁鄭文先同時提醒,“人工智能的技術(shù)進(jìn)步可以給社會帶來非常正向的效益,不應(yīng)因為對隱私保護機制等方面的憂慮而將人工智能的問題妖魔化。”他認(rèn)為,當(dāng)前人工智能的法律法規(guī)尚不健全,亟待有關(guān)部門進(jìn)一步科學(xué)制定和完善,這樣才能引導(dǎo)公眾更加健康地看待這一新技術(shù)應(yīng)用于產(chǎn)業(yè)。
亟待技術(shù)進(jìn)步 發(fā)展新一代人工智能
面對技術(shù)落地所遇到的種種“痛點”,許多專家給出了這樣的比喻:“人工智能相當(dāng)于一個錘子,不能哪一個釘子都能砸。”
“我覺得,人工智能發(fā)展的第一步是輔助,讓重復(fù)復(fù)雜的勞動量由機器完成,在這個基礎(chǔ)上,我們再創(chuàng)造條件逐漸向智能決策的方向發(fā)展。”鄭州大學(xué)教授蔣慧琴表示,對于業(yè)界有人提出“人工智能超越甚至取代人類”的期待和預(yù)計,應(yīng)保持冷靜,“只有沿著這樣的方向堅持下來,才有可能達(dá)到我們的目標(biāo)”。
中國科學(xué)技術(shù)發(fā)展戰(zhàn)略研究院研究員李修全認(rèn)為,在重復(fù)性操作的生產(chǎn)環(huán)節(jié)和基于海量數(shù)據(jù)的高強度計算優(yōu)化求解上,人工智能具有明顯優(yōu)勢,應(yīng)當(dāng)是當(dāng)前應(yīng)用于產(chǎn)業(yè)的主要方向。
華為云人工智能領(lǐng)域首席科學(xué)家田奇則認(rèn)為,加速人工智能賦能產(chǎn)業(yè)落地,其與科學(xué)計算的深度融合應(yīng)是顯著趨勢,在工業(yè)、氣象、能源、生物、醫(yī)學(xué)等領(lǐng)域,需要大量科學(xué)計算,人工智能技術(shù)能為傳統(tǒng)科學(xué)計算帶來新的思路、方法和工具,同時由于傳統(tǒng)科學(xué)計算具有嚴(yán)密性,人工智能也可以提高它本身的可解釋性。
“推動人工智能進(jìn)入新的階段,有賴于與數(shù)學(xué)、腦科學(xué)等結(jié)合實現(xiàn)底層理論的突破。”中國科學(xué)院院士、清華大學(xué)人工智能研究院院長張鈸說,未來所需要的第三代人工智能應(yīng)是實現(xiàn)可解釋的、魯棒的、可信安全的智能系統(tǒng),依靠知識、數(shù)據(jù)、算法和算力四個要素,將實現(xiàn)從不帶認(rèn)知的人工智能轉(zhuǎn)變?yōu)閹дJ(rèn)知的人工智能。
如何解釋新一代人工智能?李德毅認(rèn)為,傳統(tǒng)人工智能是計算機智能,屬于封閉型人工智能。新一代人工智能應(yīng)該是開放性人工智能。當(dāng)前,所有的計算機都是對軟件工程師的智能編程代碼進(jìn)行一次又一次簡單執(zhí)行,“但我們希望這個機器在學(xué)習(xí)過程中能夠解決新的問題,學(xué)習(xí)應(yīng)成為新一代人工智能解決現(xiàn)實問題的基礎(chǔ)”。
清華大學(xué)智能技術(shù)與系統(tǒng)國家重點實驗室教授鄧志東建議,數(shù)據(jù)和算力的增加總有天花板,要推動人工智能技術(shù)深度賦能更多行業(yè),需要的是核心關(guān)鍵技術(shù)突破,特別是認(rèn)知智能的進(jìn)步,同時,還要依靠智能高端芯片、傳感器等零部件的硬件支撐,再借助我國5G信息技術(shù)的優(yōu)勢,形成合力支撐產(chǎn)業(yè)落地和商業(yè)化應(yīng)用。
此外,人工智能標(biāo)準(zhǔn)化工作也應(yīng)加速展開。薛云志表示:“建立可信賴的人工智能需要標(biāo)準(zhǔn)化,一方面要從開發(fā)者訓(xùn)練、測試與實驗、部署運營和監(jiān)管的角度來做,另一方面則要從芯片等硬件、算法、產(chǎn)品系統(tǒng)出發(fā),來制定標(biāo)準(zhǔn)和規(guī)范,同時對人工智能的風(fēng)險、倫理、管理等標(biāo)準(zhǔn)研究也要盡快啟動,這些都只是第一步。”