【摘要】隨著數(shù)據(jù)的累積,不同科技企業(yè)在數(shù)據(jù)資源的儲(chǔ)備量上的差異愈加明顯,數(shù)據(jù)壟斷逐漸形成,并催生了“堰塞湖”,導(dǎo)致各企業(yè)間的數(shù)據(jù)難以互通,用戶隱私泄露問題隨之凸顯。因此,通過有效的數(shù)據(jù)治理來緩解數(shù)據(jù)壟斷形勢(shì)、促進(jìn)數(shù)據(jù)安全與公平的共享流通刻不容緩。一方面應(yīng)完善當(dāng)前的數(shù)據(jù)治理模式,發(fā)揮現(xiàn)有治理手段的作用;另一方面要積極開拓透明化的數(shù)據(jù)治理框架,解決以數(shù)據(jù)壟斷為主的數(shù)據(jù)倫理問題,構(gòu)建健康有序的中國(guó)大數(shù)據(jù)生態(tài)。
【關(guān)鍵詞】數(shù)據(jù)壟斷 數(shù)據(jù)治理 數(shù)據(jù)透明 【中圖分類號(hào)】F49 【文獻(xiàn)標(biāo)識(shí)碼】A
大數(shù)據(jù)時(shí)代,海量數(shù)據(jù)的累積催生了數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等新興技術(shù),同時(shí)也為這些技術(shù)預(yù)測(cè)未來、作出決策提供了基礎(chǔ),為社會(huì)創(chuàng)造了前所未有的價(jià)值。隨著數(shù)據(jù)的累積,數(shù)據(jù)作為驅(qū)動(dòng)人工智能等技術(shù)發(fā)展的重要資源,逐漸成為各科技公司爭(zhēng)奪的主要對(duì)象,不同科技企業(yè)在數(shù)據(jù)資源的儲(chǔ)備量上的差異也愈加明顯,數(shù)據(jù)壟斷逐漸形成,并催生了“堰塞湖”,各企業(yè)間的數(shù)據(jù)難以互通,并且由于數(shù)據(jù)本身與個(gè)人隱私的密切關(guān)系,用戶隱私泄露問題亦隨之凸顯。筆者帶領(lǐng)團(tuán)隊(duì)基于3000萬真實(shí)用戶數(shù)據(jù)和30萬APP數(shù)據(jù),對(duì)當(dāng)前的數(shù)據(jù)收集情況進(jìn)行了量化分析發(fā)現(xiàn),當(dāng)前數(shù)據(jù)壟斷形勢(shì)異常嚴(yán)峻,對(duì)數(shù)據(jù)進(jìn)行有效治理迫在眉睫,而數(shù)據(jù)透明化應(yīng)是未來數(shù)據(jù)治理的主題和必經(jīng)之路。
當(dāng)前移動(dòng)應(yīng)用軟件市場(chǎng)的數(shù)據(jù)壟斷現(xiàn)狀
為量化當(dāng)前移動(dòng)應(yīng)用市場(chǎng)的數(shù)據(jù)壟斷情況,筆者基于3000萬真實(shí)用戶數(shù)據(jù)和30萬APP數(shù)據(jù),使用權(quán)限分析法對(duì)2018與2019兩年大數(shù)據(jù)收集現(xiàn)狀進(jìn)行分析。分析的主要對(duì)象包括:數(shù)據(jù)生產(chǎn)者,即產(chǎn)生數(shù)據(jù)的個(gè)人或機(jī)構(gòu),在移動(dòng)應(yīng)用場(chǎng)景中通常指移動(dòng)用戶;數(shù)據(jù)收集者,即以主動(dòng)或被動(dòng)的方式收集數(shù)據(jù)的個(gè)人或機(jī)構(gòu),在移動(dòng)應(yīng)用場(chǎng)景中通常指APP開發(fā)商;數(shù)據(jù)使用者,即以任何形式處理或使用數(shù)據(jù)的個(gè)人或機(jī)構(gòu),在移動(dòng)應(yīng)用場(chǎng)景中它可以是數(shù)據(jù)收集者,也可以是通過數(shù)據(jù)流通、共享等方式獲取數(shù)據(jù)的第三方;數(shù)據(jù)監(jiān)管者,即在數(shù)據(jù)收集、流通、使用過程中對(duì)數(shù)據(jù)進(jìn)行合法監(jiān)管的個(gè)人或機(jī)構(gòu),通常包括相關(guān)政府機(jī)構(gòu)和可信第三方等。分析結(jié)果顯示,當(dāng)前移動(dòng)應(yīng)用市場(chǎng)數(shù)據(jù)壟斷形勢(shì)十分嚴(yán)峻,10%的數(shù)據(jù)收集者可獲取99%的用戶權(quán)限數(shù)據(jù),數(shù)據(jù)收集的不平衡現(xiàn)象遠(yuǎn)甚于社會(huì)財(cái)富分配中的二八定律。
首先,從總體數(shù)據(jù)壟斷現(xiàn)狀來看,為詳細(xì)闡明該數(shù)據(jù)收集現(xiàn)狀,筆者根據(jù)獲取權(quán)限數(shù)據(jù)的數(shù)量級(jí)對(duì)數(shù)據(jù)收集者進(jìn)行劃分,將獲取1億及以上權(quán)限數(shù)據(jù)的收集者定義為“億級(jí)權(quán)限數(shù)據(jù)收集者”,獲取1億以下1千萬以上權(quán)限數(shù)據(jù)的數(shù)據(jù)收集者定義為“千萬級(jí)權(quán)限數(shù)據(jù)收集者”,并以此類推。主要結(jié)論如下:根據(jù)2019年總體數(shù)據(jù)收集狀況,當(dāng)前數(shù)據(jù)壟斷形勢(shì)嚴(yán)峻,極少數(shù)數(shù)據(jù)收集者壟斷了絕大部分權(quán)限數(shù)據(jù)。2019年度數(shù)據(jù)壟斷的“主力軍”是占據(jù)所有數(shù)據(jù)收集者數(shù)量1%的“百萬級(jí)、千萬級(jí)、億級(jí)的權(quán)限數(shù)據(jù)收集者”,他們可獲取約92%的權(quán)限數(shù)據(jù)。對(duì)比2018年度與2019年度數(shù)據(jù)壟斷狀況,前10%的權(quán)限數(shù)據(jù)收集者獲取的權(quán)限數(shù)據(jù)量占比略有減少,但總體上數(shù)據(jù)壟斷態(tài)勢(shì)居高不下。具體而言,不同級(jí)別權(quán)限數(shù)據(jù)收集者的數(shù)量與獲取數(shù)據(jù)量的對(duì)比分布如圖1所示,“百萬級(jí)、千萬級(jí)、億級(jí)的權(quán)限數(shù)據(jù)收集者”本身的數(shù)量極小,但權(quán)限數(shù)據(jù)獲取量均在10%以上,而其余大量的數(shù)據(jù)收集者可獲取的數(shù)據(jù)量不足3%。該狀況從不同比例數(shù)據(jù)收集者獲取權(quán)限數(shù)據(jù)分布情況中體現(xiàn)得更為明顯,如圖2所示。表1給出2018年度與2019年度權(quán)限數(shù)據(jù)收集的對(duì)比情況,其變化量為負(fù)值說明這些權(quán)限數(shù)據(jù)收集者獲取數(shù)據(jù)量占比有所減少,但權(quán)限數(shù)據(jù)收集者數(shù)量超過5%后,其獲取數(shù)據(jù)量的變化微乎其微??梢?,我國(guó)總體數(shù)據(jù)壟斷形勢(shì)依舊嚴(yán)峻。
其次,從分類數(shù)據(jù)壟斷現(xiàn)狀來看,筆者所在團(tuán)隊(duì)對(duì)Google Play及國(guó)內(nèi)第三方應(yīng)用網(wǎng)站中APP分類進(jìn)行調(diào)研,將當(dāng)前市場(chǎng)上的APP劃分為20類,分別是安全類、生活類、社交類、辦公類、理財(cái)類、購(gòu)物類、教育類、兒童類、旅游出行類、攝影圖片類、視頻類、工具類、通信類、新聞?lì)?、醫(yī)療類、音樂類、游戲類、娛樂類、閱讀類和運(yùn)動(dòng)類?;谠摲诸?,得出如下結(jié)論:每類APP的數(shù)據(jù)壟斷形勢(shì)都十分嚴(yán)峻,前10%的數(shù)據(jù)收集者均收集了不少于97%的權(quán)限數(shù)據(jù)。各類APP中,工具類、社交類和游戲類為數(shù)據(jù)壟斷的重災(zāi)區(qū),教育類和閱讀類的數(shù)據(jù)壟斷狀況較總體水平有所緩解。具體情況如圖3所示,工具類、社交類和游戲類的前0.1%數(shù)據(jù)收集者收集了約80%的權(quán)限數(shù)據(jù),前1%的數(shù)據(jù)收集者收集了約95%的權(quán)限數(shù)據(jù),而前5%的數(shù)據(jù)收集者就收集了約99%的權(quán)限數(shù)據(jù)。在形勢(shì)較為緩和的教育類和閱讀類,前1%的數(shù)據(jù)收集者收集了約75%的權(quán)限數(shù)據(jù),低于該比例數(shù)據(jù)收集者對(duì)應(yīng)的總體占比。
最后,從主要數(shù)據(jù)收集者壟斷現(xiàn)狀來看,筆者對(duì)數(shù)據(jù)獲取量排名前5的數(shù)據(jù)收集者對(duì)比分析,以展示當(dāng)前主要數(shù)據(jù)收集者的壟斷現(xiàn)狀。為保護(hù)數(shù)據(jù)收集者的個(gè)體隱私,該分析隱藏這5個(gè)數(shù)據(jù)收集者的名稱,僅提供統(tǒng)計(jì)性結(jié)果。這5個(gè)數(shù)據(jù)數(shù)據(jù)者,最多的可獲取8%的權(quán)限數(shù)據(jù),最少者可獲取3%的權(quán)限數(shù)據(jù),累計(jì)可獲取近24%的數(shù)據(jù)。也就是說,僅這5個(gè)數(shù)據(jù)收集者,就可獲取約1/4的用戶數(shù)據(jù)。其中,3個(gè)數(shù)據(jù)收集者所開發(fā)APP涉及了18個(gè)以上的APP類別,其余2個(gè)數(shù)據(jù)收集者側(cè)重于單個(gè)領(lǐng)域,其開發(fā)APP僅涉及了不足5個(gè)類別。這5個(gè)數(shù)據(jù)收集者的共同點(diǎn)是:其開發(fā)APP對(duì)應(yīng)的用戶量群體均十分龐大。
以當(dāng)前數(shù)據(jù)收集者們的數(shù)據(jù)獲取量為依據(jù),分析數(shù)據(jù)壟斷的成因
在嚴(yán)峻的數(shù)據(jù)壟斷形勢(shì)下,探究數(shù)據(jù)壟斷成因十分關(guān)鍵。當(dāng)前數(shù)據(jù)壟斷的形成與數(shù)據(jù)自身的特點(diǎn)、數(shù)據(jù)收集者們的商業(yè)運(yùn)營(yíng)模式以及人工智能時(shí)代的網(wǎng)絡(luò)效應(yīng)密切相關(guān)。
第一,數(shù)據(jù)易聚集、難確權(quán)的特性,使得數(shù)據(jù)壟斷易形成。大數(shù)據(jù)時(shí)代,海量數(shù)據(jù)通過移動(dòng)設(shè)備、傳感器網(wǎng)絡(luò)等源源不斷地自動(dòng)產(chǎn)生,數(shù)據(jù)的生產(chǎn)成本較低,同時(shí)其本身的價(jià)值密度也較低,海量數(shù)據(jù)的價(jià)值需通過數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù)提取。而這些技術(shù)本質(zhì)上是數(shù)據(jù)驅(qū)動(dòng)型技術(shù),需基于大量數(shù)據(jù)的輸入才能獲取高準(zhǔn)確性、高可用性的輸出結(jié)果,造成數(shù)據(jù)本身易聚集的特點(diǎn)。此外,數(shù)據(jù)本身的特殊性使其既不同于石油、礦藏類的自然產(chǎn)物,也不同于專利、作品等精神產(chǎn)物,難以確定其所有權(quán)。在當(dāng)前數(shù)據(jù)不能依據(jù)法律法規(guī)確權(quán)的現(xiàn)狀下,數(shù)據(jù)收集的合理合規(guī)性得不到有效保證,易形成數(shù)據(jù)壟斷。
第二,數(shù)據(jù)寡頭多產(chǎn)品、跨領(lǐng)域、高用戶量的商業(yè)運(yùn)營(yíng)特點(diǎn),是數(shù)據(jù)壟斷形成的重要因素。數(shù)據(jù)寡頭即當(dāng)前數(shù)據(jù)壟斷的主要對(duì)象,對(duì)應(yīng)的就是排名前0.1%的數(shù)據(jù)收集者。當(dāng)前數(shù)據(jù)寡頭們通過業(yè)務(wù)擴(kuò)張、資本運(yùn)作、并購(gòu)等方式完成企業(yè)擴(kuò)張,導(dǎo)致其具有多產(chǎn)品、跨領(lǐng)域的商業(yè)特點(diǎn),并據(jù)此吸引或維系海量用戶,從而具有海量數(shù)據(jù)收集的能力,形成數(shù)據(jù)壟斷。分析結(jié)果表明,在移動(dòng)應(yīng)用市場(chǎng),數(shù)據(jù)收集者們開發(fā)APP的數(shù)量越多、使用量越高、涉足的領(lǐng)域越多,其獲取的權(quán)限數(shù)據(jù)量越大,越有可能成為數(shù)據(jù)寡頭,形成數(shù)據(jù)壟斷。顯然,前0.1%的權(quán)限數(shù)據(jù)收集者的這三個(gè)因素比其他權(quán)限數(shù)據(jù)收集者明顯高出數(shù)倍。
第三,人工智能時(shí)代的網(wǎng)絡(luò)效應(yīng)促進(jìn)數(shù)據(jù)壟斷形成。人工智能技術(shù)數(shù)據(jù)驅(qū)動(dòng)的特點(diǎn)使其本身就具有網(wǎng)絡(luò)效應(yīng)。隨著人工智能技術(shù)產(chǎn)品使用的用戶量激增,該技術(shù)可獲取更多用戶的數(shù)據(jù)輸入,從而可創(chuàng)建可用性更高的數(shù)據(jù)模型,增加其自身價(jià)值的同時(shí)吸引并服務(wù)于更多用戶。當(dāng)前移動(dòng)應(yīng)用市場(chǎng)上的數(shù)據(jù)寡頭均為大型科技公司,他們均受益于人工智能等技術(shù)的支持。相應(yīng)地,基于其海量的用戶數(shù)據(jù),他們可持續(xù)發(fā)展優(yōu)化其產(chǎn)品與服務(wù),進(jìn)一步維持并吸引新用戶。而本身處于弱勢(shì)的數(shù)據(jù)收集者們則限于其產(chǎn)品或服務(wù)的升級(jí)能力,迫于數(shù)據(jù)寡頭發(fā)展的壓力逐漸流失用戶,滾雪球效應(yīng)產(chǎn)生,數(shù)據(jù)壟斷現(xiàn)象隨之加劇。
緩解數(shù)據(jù)壟斷形勢(shì)、促進(jìn)數(shù)據(jù)安全與公平的共享流通,三種數(shù)據(jù)治理模式更為有效
嚴(yán)峻的數(shù)據(jù)壟斷形勢(shì)給當(dāng)前移動(dòng)互聯(lián)網(wǎng)的發(fā)展帶來了巨大的挑戰(zhàn)。數(shù)據(jù)壟斷使得寡頭公司擁有大部分的用戶數(shù)據(jù),在數(shù)據(jù)驅(qū)動(dòng)的發(fā)展模式下,壓縮了該領(lǐng)域內(nèi)其他公司的生存空間,不利于小型企業(yè)的發(fā)展。數(shù)據(jù)壟斷一定程度上破壞了市場(chǎng)自由競(jìng)爭(zhēng)的規(guī)則,數(shù)據(jù)寡頭公司基于海量數(shù)據(jù)資本掌握市場(chǎng)主導(dǎo)權(quán)。對(duì)小型企業(yè)的打壓,使得消費(fèi)者失去同類服務(wù)的可替代選項(xiàng)。數(shù)據(jù)壟斷有可能阻斷小型企業(yè)的技術(shù)創(chuàng)新,而大型企業(yè)利用其豐富的數(shù)據(jù)可開發(fā)多領(lǐng)域的生產(chǎn)經(jīng)營(yíng)活動(dòng),技術(shù)壁壘進(jìn)一步抑制了新技術(shù)的產(chǎn)生。數(shù)據(jù)壟斷使得寡頭企業(yè)一家獨(dú)大,掌握對(duì)用戶數(shù)據(jù)的控制權(quán),易加劇數(shù)據(jù)濫用、隱私泄露、用戶歧視等其他數(shù)據(jù)倫理問題的產(chǎn)生。因此,一方面,應(yīng)規(guī)范數(shù)據(jù)的收集、流通和使用,促進(jìn)數(shù)據(jù)資源的合理配置;另一方面,應(yīng)積極探索用戶隱私保護(hù)的數(shù)據(jù)共享方式,促進(jìn)數(shù)據(jù)共享流通?,F(xiàn)有的數(shù)據(jù)治理模式包含以下三種:
一是局部模式。在數(shù)據(jù)流通前,從數(shù)據(jù)源頭基于隱私保護(hù)技術(shù)對(duì)數(shù)據(jù)進(jìn)行處理,一定程度上能夠限制企業(yè)收集大規(guī)模數(shù)據(jù)的行為。當(dāng)前應(yīng)用的隱私保護(hù)技術(shù)主要包括基于擾動(dòng)的匿名化、差分隱私技術(shù)和基于密碼學(xué)的安全多方計(jì)算等,這些技術(shù)提供的隱私保護(hù)程度越高,收集數(shù)據(jù)的準(zhǔn)確性越差,計(jì)算成本也就越高。數(shù)據(jù)收集者必須平衡隱私保護(hù)與數(shù)據(jù)有效價(jià)值之間的關(guān)系,從而緩解當(dāng)前低成本的數(shù)據(jù)收集壟斷局勢(shì)。在該治理模式下,數(shù)據(jù)寡頭仍持有大部分?jǐn)?shù)據(jù)的控制權(quán),數(shù)據(jù)壟斷有所緩解但并未根除,并且需要權(quán)衡好數(shù)據(jù)治理與產(chǎn)業(yè)輸出之間的關(guān)系。
二是中介模式。在數(shù)據(jù)流通過程中增加第三方中介平臺(tái),參與數(shù)據(jù)流通,促進(jìn)數(shù)據(jù)共享。當(dāng)前的中介平臺(tái)主要包括數(shù)據(jù)交易平臺(tái)、數(shù)據(jù)眾包平臺(tái)和數(shù)據(jù)共享平臺(tái)三種模型,分別適用于不同情景。自2015年國(guó)務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》以來,全國(guó)范圍內(nèi)涌現(xiàn)出多個(gè)數(shù)據(jù)交易平臺(tái),包括以數(shù)據(jù)包交易為主的政府類數(shù)據(jù)交易所,如貴州大數(shù)據(jù)交易所、上海數(shù)據(jù)交易中心、長(zhǎng)江大數(shù)據(jù)交易中心等,以及以API接口模式為主的民營(yíng)平臺(tái),如聚合數(shù)據(jù)、京東萬象、數(shù)據(jù)堂等。數(shù)據(jù)眾包平臺(tái)為企業(yè)或個(gè)人提供有償?shù)臄?shù)據(jù)供應(yīng)及下載途徑,目前有百度數(shù)據(jù)眾包、有道眾包、螞蟻眾包等平臺(tái)。數(shù)據(jù)共享平臺(tái)包括數(shù)據(jù)直接共享和數(shù)據(jù)間接共享兩種方式。直接數(shù)據(jù)共享平臺(tái)依據(jù)必要的設(shè)施規(guī)則,推動(dòng)公共部門之間不對(duì)稱信息的流通和企業(yè)之間數(shù)據(jù)的合理共享,較為典型的是英國(guó)人工智能實(shí)驗(yàn)室與開放數(shù)據(jù)研究所合作建立的“數(shù)據(jù)信托”實(shí)驗(yàn)點(diǎn),其目的是促進(jìn)多集團(tuán)之間的數(shù)據(jù)共享。間接數(shù)據(jù)共享平臺(tái)拒絕對(duì)源數(shù)據(jù)的直接共享,支持對(duì)本地?cái)?shù)據(jù)訓(xùn)練得到的模型參數(shù)進(jìn)行共享,而后由多方參與者共同訓(xùn)練效果較強(qiáng)的機(jī)器學(xué)習(xí)模型。該方法符合當(dāng)前數(shù)據(jù)驅(qū)動(dòng)的技術(shù)發(fā)展情景與用戶隱私保護(hù)的需求,具代表性的是微眾聯(lián)邦學(xué)習(xí)項(xiàng)目與華為NAIE聯(lián)邦學(xué)習(xí)平臺(tái)。從總體發(fā)展現(xiàn)狀來看,第三方中介的項(xiàng)目眾多,但目前數(shù)據(jù)交易、共享的規(guī)模并不大,具有很大的發(fā)展空間。
三是全局模式。對(duì)數(shù)據(jù)產(chǎn)生、流通和使用的整個(gè)生命周期進(jìn)行監(jiān)管,弱化數(shù)據(jù)寡頭對(duì)數(shù)據(jù)的掌控權(quán),增強(qiáng)數(shù)據(jù)生成者(即用戶)和數(shù)據(jù)監(jiān)管者對(duì)數(shù)據(jù)的控制權(quán)。該模式主要分為中心化和去中心化兩種形式。中心化全局模式是指建立統(tǒng)一的數(shù)據(jù)監(jiān)管平臺(tái),對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一管理,如庫克提議美國(guó)聯(lián)邦貿(mào)易委員會(huì)組建的“數(shù)據(jù)清算所”,通過監(jiān)管數(shù)據(jù)流通狀況來確保用戶對(duì)數(shù)據(jù)的控制權(quán)。去中心化全局模式指借助區(qū)塊鏈、智能合約等去中心化技術(shù)與平臺(tái),對(duì)數(shù)據(jù)收集、流通、共享、使用、結(jié)算等過程存證,構(gòu)建可驗(yàn)證、可追蹤、可溯源的數(shù)據(jù)共享與監(jiān)管機(jī)制,目前已有眾多政府機(jī)構(gòu)與學(xué)術(shù)機(jī)構(gòu)在此方面展開研究。全局模式相較其他兩種治理模型成本更高,目前該數(shù)據(jù)治理體系正在構(gòu)建中,其應(yīng)用尚不成熟。
數(shù)據(jù)透明是解決數(shù)據(jù)壟斷問題的根本途徑,是未來數(shù)據(jù)治理的必經(jīng)之路
上述數(shù)據(jù)治理模式以政府和IT企業(yè)為主要參與者,針對(duì)數(shù)據(jù)壟斷、阻塞、不互通等問題提出局部或全局的治理方案,重點(diǎn)在于可監(jiān)控的數(shù)據(jù)資產(chǎn)平衡分配。然而,當(dāng)下的數(shù)據(jù)壟斷問題不僅僅是數(shù)據(jù)資產(chǎn)的分配失衡問題,更是人工智能時(shí)代數(shù)據(jù)倫理的問題,數(shù)據(jù)壟斷的加劇會(huì)導(dǎo)致數(shù)據(jù)隱私、數(shù)據(jù)歧視等其他倫理問題的發(fā)生。筆者認(rèn)為,當(dāng)下大數(shù)據(jù)的“堰塞湖”已然形成,數(shù)據(jù)壟斷愈發(fā)嚴(yán)重,數(shù)據(jù)隱私與公平問題層出不窮,歸根結(jié)底是數(shù)據(jù)收集、流通、共享、使用和決策過程中的不透明性所致。因此,數(shù)據(jù)透明是解決上述問題的根本途徑,是未來數(shù)據(jù)治理的必經(jīng)之路。
數(shù)據(jù)透明,并不表示數(shù)據(jù)對(duì)所有人公開可見,它指的是數(shù)據(jù)在其生命周期中對(duì)其從屬主體透明化,即在數(shù)據(jù)收集、流通、共享、使用和決策過程中,保證數(shù)據(jù)對(duì)其擁有者、使用者和監(jiān)管者顯示部分或全部的透明性。在整個(gè)數(shù)據(jù)透明框架中,數(shù)據(jù)的隱私必須加以考慮并得到保證。對(duì)數(shù)據(jù)壟斷而言,數(shù)據(jù)透明的應(yīng)用可促進(jìn)數(shù)據(jù)收集、流通和使用記錄的生成,從而完成數(shù)據(jù)的審計(jì)、溯源與問責(zé)。該方式既可達(dá)到數(shù)據(jù)監(jiān)管的目的,又可為數(shù)據(jù)共享方向與方式提供評(píng)估依據(jù),結(jié)合數(shù)據(jù)訪問控制技術(shù)可全方面監(jiān)控并防止數(shù)據(jù)壟斷的生成。
宏觀上,基于數(shù)據(jù)透明的數(shù)據(jù)治理應(yīng)聚焦于以下三個(gè)方面內(nèi)容:第一方面,保證數(shù)據(jù)質(zhì)量與價(jià)值。數(shù)據(jù)作為大數(shù)據(jù)時(shí)代科技企業(yè)的主要資源,在使用數(shù)據(jù)治理手段協(xié)調(diào)各個(gè)社會(huì)主體利益時(shí),應(yīng)基于數(shù)據(jù)透明機(jī)制保證數(shù)據(jù)的真實(shí)性、正確性,統(tǒng)一多源數(shù)據(jù)標(biāo)準(zhǔn),評(píng)估有效數(shù)據(jù)價(jià)值,從而保證數(shù)據(jù)驅(qū)動(dòng)決策的可靠性。第二方面,評(píng)估和監(jiān)管個(gè)人隱私數(shù)據(jù)的使用。用戶作為大數(shù)據(jù)生產(chǎn)者,極易在數(shù)據(jù)流通過程中丟失對(duì)自身數(shù)據(jù)的控制權(quán)。基于數(shù)據(jù)透明,可評(píng)估和監(jiān)管個(gè)人隱私數(shù)據(jù)的流向及用途,使用戶重拾數(shù)據(jù)控制權(quán),有效避免數(shù)據(jù)過度收集與聚積,預(yù)防個(gè)人隱私數(shù)據(jù)泄露。第三方面,監(jiān)管并促進(jìn)數(shù)據(jù)流通與共享。這也是阻斷數(shù)據(jù)壟斷的重要舉措,但在實(shí)施時(shí)需兼顧數(shù)據(jù)隱私,考慮各參與主體間的信任模型,平衡各方利益。
具體而言,基于數(shù)據(jù)透明的數(shù)據(jù)治理可借助區(qū)塊鏈技術(shù)實(shí)現(xiàn)?;趨^(qū)塊鏈公開透明、去中心化和不可篡改的特性,可在數(shù)據(jù)生命周期中的各階段分別進(jìn)行有效的數(shù)據(jù)治理。在數(shù)據(jù)存儲(chǔ)階段,基于區(qū)塊鏈和智能合約存儲(chǔ)數(shù)據(jù),可達(dá)到支持審計(jì)的目的,防止該過程中數(shù)據(jù)偽造、數(shù)據(jù)篡改、數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一等問題的出現(xiàn)。在數(shù)據(jù)收集與共享階段,可使用區(qū)塊鏈保存數(shù)據(jù)的收集與共享日志,對(duì)數(shù)據(jù)流通過程進(jìn)行追蹤溯源;同時(shí)結(jié)合策略承諾、違法檢測(cè)、隱私審計(jì),可在隱私保護(hù)技術(shù)失效的情況下通過溯源問責(zé)保護(hù)隱私,并為實(shí)施數(shù)據(jù)監(jiān)管、防止數(shù)據(jù)壟斷提供技術(shù)支持。在數(shù)據(jù)使用與決策階段,可基于區(qū)塊鏈對(duì)數(shù)據(jù)計(jì)算節(jié)點(diǎn)進(jìn)行驗(yàn)證,通過經(jīng)濟(jì)懲罰等手段防止惡意參與方的加入,同時(shí)驗(yàn)證決策結(jié)果的可靠性,確保數(shù)據(jù)的高效合理產(chǎn)出。
2020年4月6日,中共中央、國(guó)務(wù)院印發(fā)的《關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見》提出,要加快培育數(shù)據(jù)要素市場(chǎng)的概念,并強(qiáng)調(diào)了數(shù)據(jù)的開放與共享。這使得解決數(shù)據(jù)壟斷問題、評(píng)估和監(jiān)管數(shù)據(jù)的合理分配與使用,變得更加緊迫和必要。同時(shí),它也對(duì)數(shù)據(jù)共享流通方式和數(shù)據(jù)質(zhì)量等提出了更高的要求。將數(shù)據(jù)作為要素應(yīng)該放在數(shù)據(jù)治理的框架下加以考量,需要綜合考慮數(shù)據(jù)生命周期內(nèi)相關(guān)參與主體的權(quán)利與義務(wù)。在未來數(shù)據(jù)治理的過程中,我們一方面要完善當(dāng)前的數(shù)據(jù)治理模式,發(fā)揮現(xiàn)有治理手段的作用;另一方面要積極開拓透明化的數(shù)據(jù)治理框架,解決以數(shù)據(jù)壟斷為主的數(shù)據(jù)倫理問題,構(gòu)建健康有序的中國(guó)大數(shù)據(jù)生態(tài),促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)合理規(guī)范發(fā)展。
(作者為中國(guó)人民大學(xué)信息學(xué)院教授、博導(dǎo))
【參考文獻(xiàn)】
①《中共中央 國(guó)務(wù)院關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見》,中國(guó)政府網(wǎng),2020年4月6日。
②《國(guó)務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知》,中國(guó)政府網(wǎng),2015年9月5日。
③《習(xí)近平:實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略,加快建設(shè)數(shù)字中國(guó)》,《人民日?qǐng)?bào)》,2017年12月10日。
責(zé)編/韓拓 美編/陳媛媛
聲明:本文為人民論壇雜志社原創(chuàng)內(nèi)容,任何單位或個(gè)人轉(zhuǎn)載請(qǐng)回復(fù)本微信號(hào)獲得授權(quán),轉(zhuǎn)載時(shí)務(wù)必標(biāo)明來源及作者,否則追究法律責(zé)任。