胡凌
大數據伴隨著互聯網產業的發展而產生,特別是移動互聯網和物聯網的興起,使得數據搜集更為便利和廣泛。同時,數據分析業務開始成為互聯網行業的特色和主營業務,它可以更為精準地分析和預測消費者與客戶的行為,帶來更多價值,從而迫使傳統行業紛紛向互聯網靠攏。大數據革命作為一種被投資人追捧、被媒體炒作的概念還將持續升溫,但人們往往忽視大數據在中國成為現實的歷史進程和諸多條件,特別是網絡經濟作為一種新興的經濟力量如何借助成熟的商業模式和不完備的舊法律制度來開拓疆域。
筆者將簡要討論這些因素,試圖幫助理解未來如何發生。首先,作為一個整體的互聯網行業發現了免費模式,在吸引消費者的同時獲得了大量數據資產,這一過程伴隨著互聯網平臺和移動互聯網的興起變得更加明顯。其次,新經濟通過生產工具的變革重塑了互聯網的架構,從更多的免費勞動力手中攫取有價值的生產資料。第三,無論是免費內容還是消費者數據,互聯網都沒有受到強大的法律約束。而商業模式、技術變遷和用戶協議中體現的所有權和使用權的分離原則為大數據時代鋪平了道路。最后,互聯網帶來的由商品到服務的轉變,進一步擴展了新經濟對數據的占有和使用,并對保護舊生產方式和生產力的傳統法律提出挑戰。
免費商業模式與數據資產
免費內容與服務基本上已成為互聯網行業的標準模式,通過免費來吸引用戶,賺取廣告收入和增值收入。如果說最早的門戶網站還秉持著傳統媒體經營的思路,那么從電子郵件、即時通訊到安全軟件、網絡游戲等行業紛紛實行免費,都證明了這一邏輯的勢不可擋。
免費商業模式的影響是巨大的,它將傳統壟斷經濟學上的“雙邊市場”理論推到極致,依托多個免費的產品市場吸引用戶,而通過少數市場獲取增值收入;因為可以向無數用戶同時提供低成本的服務,只要有少數人付費即可獲利。這就是為什么很多互聯網公司在提供一項主要服務以外,都逐漸擴展至各種服務?;ヂ摼W公司之間的競爭也不僅僅局限在單項產品市場中,而是跨越多個市場的綜合競爭(Evans, 2011)。這一點最近在騰訊壟斷案中得到廣東省高級法院的確認,拓展了人們對新經濟本質的認識。
這些免費服務被一些互聯網公司視為“基礎服務”,與“增值服務”相對應。它們不靠一次性出售書籍、光碟、報紙、流量獲利,因而是對傳統文化產品、媒體和電信服務生產方式的反動。消費者享受了免費而便捷的基礎服務之后,才有動力留在互聯網上進一步消費??梢钥吹?,基礎服務的范圍在不斷擴大,從信息內容逐漸擴展至金融、保險、醫療、教育和郵政領域。用戶使用的基礎服務越多,互聯網企業對其偏好和信息的了解就越廣泛,并通過大量用戶類似行為進行相關性分析。(Sch?nberger & Cukier, 2013)
在這一過程中,數據本身對這類輕資產公司而言越來越重要,其價值可以得到二次或多次挖掘,逐漸成為一種寶貴資產?;A服務本身要求被免費提供,而基于數據分析提供的增值服務才是互聯網價值鏈上最耀眼的一環。從這個意義上講,互聯網并非傳統媒體和文化行業的競爭者;它們需要把后者納入其平臺,承認自身的地位,并迫使其合作?;ヂ摼W十余年來同音樂界、文學界、影視界和電信業的戰爭已經無數次說明了這一點。(Levine, 2012)
這也是為什么互聯網內部的不正當競爭越來越圍繞數據資產展開,例如大眾點評網和愛幫網的訴訟,以及最近的360綜合搜索與百度的糾紛。越來越多的互聯網公司開始通過技術手段保護自己的數據資產不被惡意復制和侵占,這些信息內容可以免費被消費者使用,卻不能被其競爭對手輕易獲取,防止反過來同自己展開競爭。為完美地實現這一點,互聯網平臺的興起在所難免。通過對內容、服務、應用、操作系統、硬件終端甚至是管道的垂直整合,互聯網公司可以排他地向用戶提供一站式服務。蘋果公司的產品就是一個極好的例子,也成為眾多互聯網公司效仿的榜樣。1990年代中期,微軟因在windows操作系統上捆綁獨家IE瀏覽器和媒體播放器而受到反壟斷指控并受處罰,但十余年后終端捆綁現象無處不在,這說明了互聯網架構從開放轉向封閉已經深入人心。(Zittrain, 2008)
無處不在的計算、終端和勞動力
在發展過程中,互聯網形象在人們心目中經歷了不同的想象:從新媒體、信息服務到現在的數據分析業。前兩者甚至決定了國家管理互聯網的基本思路:歸口和屬地化管理。但數據分析業務將真正超越條塊分割的現狀,從各種渠道和方式獲取價值。一旦互聯網行業無法被封殺打壓,在積累了海量數據的基礎上,它們就會減少對純粹吸引用戶的基礎服務的需求(可以同傳統行業展開合作或者外包),減少對盜版內容的需求,從而向更加精細的大數據分析進發。
海量數據的獲取離不開數據聚合處理的平臺,以及生產數據資產的勞動力和工具。隨著移動終端的大規模普及和背后云計算的支撐,個人電腦不再是用戶接入互聯網的唯一方式,甚至不再是主要方式。未來的眼鏡、手表、汽車、各種可佩帶物品均可成為人們相互溝通、獲取信息的媒介和硬件。人們通過這些信息終端使用在線服務的時間和地點,將不像臺式機時代那樣固定。當人們可以在盈余時間中使用無處不在的互聯網服務時,大量個人數據就可以更容易地得到深度記錄和分析,生產工具的廉價和普及為大數據時代奠定了物質基礎。(Shirky, 2010)
從數據生產的意義上講,用戶和互聯網的關系不僅僅是消費者和服務提供者的關系,或者反對傳統利益和權力的同盟軍的關系,而是可以被看成是免費勞動力和工廠的關系?;ヂ摼W時代預示著人們不再是被動的文化產品消費者,他們通過創生性的終端同樣可以成為文化的生產者和創造者。對新經濟而言,用戶不僅僅是他們自身文化的生產者,同時也在為互聯網企業生產信息內容(Scholz, 2012; Boutang, 2012)。每時每刻都有大量的文字、圖片、視頻上傳至網上,在用戶之間分享。信息傳播和流通的速度越來越快(可以比較下早期的BBS和當代“共時性”的微博),同信用貨幣一樣,信息能夠轉化為更多的價值。同時,在一系列意識形態的鼓舞下(言論表達自由、信息自由流通、禮物經濟、分享、合作、積極行動),用戶對群體生產者的身份引以為傲,這進一步推動了互聯網經濟的發展。
如果說用戶是初級生產資料(非結構化數據)的生產者,第三方應用開發者(或者參與QQ互聯的網站)則是大數據時代新經濟生態系統的次級生產者和初級挖掘者。他們從平臺提供商那里獲得開放API接口和不同目標用戶的信息,開發各種應用服務,獲得的收入與后者分成,反過來又增加了平臺的整體價值。平臺免除了中小開發者自己開辦網站積累流量、從頭搜集用戶數據的不確定性,允許他們有條件地使用自己的海量數據。未來隨著平臺和終端可以擴展至對一切事物的控制,用戶越來越難以轉換到另一個競爭性的平臺,從而成為某一割裂的互聯網帝國的忠實屬民。
所有權與使用權的分離
上述圍繞數據展開的復雜權力結構和利益關系的法律基礎常常被忽視,這一基礎可以歸納為法律學者耳熟能詳的“所有權與使用權的分離”。盡管很多學者還在探討信息所有權的法律結構,現實已經清楚地表明:互聯網時代的信息所有權并不重要,重要的是誰有權使用各種信息和數據,能夠產生何種價值。
首先,如前所述,終端經歷了從臺式機到無處不在的信息設備的演化。當人們的文檔、圖片、音樂還能夠儲存在本地、通過本地計算使用的時候,很容易將其比擬成可以支配和控制的“財產”。然而,當越來越多的個人文檔被鼓勵上傳至云端,能夠通過移動終端隨時訪問時,它們將脫離擁有者的控制,并被云儲存服務商進行使用和分析。通行的用戶協議要求至少以分析的方式永久使用用戶上傳的個人文檔,要求獲得這種使用權,是大數據產生價值的必然要求。
其次,類似地,當人們通過磁盤或光盤安裝某種軟件或游戲的時候,對物理實體的認知容易將這類產品視為和鞋子一樣的“財產”,因為可以自行掌控。然而當越來越多的軟件、信息內容和游戲通過在線方式提供,并可以隨時更新的時候,它們不再被看成產品,而是一種源源不斷的服務。用戶需要容忍它們的質量瑕疵,甚至無法獲賠由此造成的損失。通過用戶協議進行的這種約定,有利于向大規模用戶同時提供服務,并將互聯網公司自身的風險降至最低。它們不會授予用戶所有權,而只是免費的無保障的使用權。類似的機制,還普遍體現在網絡游戲中的虛擬物品和企業虛擬貨幣上面,它們迎合了人腦對金錢和實物財產的敏感和本能欲望,卻絕不通過用戶協議為用戶創設財產權利,從而并不保護這類“虛擬”(illusionary)產權。
再次,像百度MP3或文庫那樣的利用盜版作品的服務模式一度促成了互聯網的“非法”興起。這可以部分歸因為互聯網公司從免費使用盜版作品獲得的可能收益遠遠超過侵權損害賠償數額,部分歸因為各種官辦著作權集體管理組織維權的低效。同時,由于存在“避風港”規則的庇護,作家或音樂人長期以來只能要求互聯網公司被動地刪除侵權作品,而不能強制其主動監控侵權內容。因而,在大量盜版作品被通知刪除之前,互聯網公司事實上通過使用而獲得了非法收益?!氨茱L港”規則意在平衡新舊利益,但實際上保護了作為一個整體的靠免費信息內容為生的互聯網行業。更重要的是,互聯網免費模式要求在生產方式上(opt-out)改變傳統的授權模式(opt-in),這進一步凸顯了使用權的重要性。(胡凌,2013)
第四,互聯網還通過各種機制鼓勵用戶為其生產信息內容。這一生產活動的最終分配,通過用戶協議明確約定:即用戶仍然對其發表在某一互聯網服務公開區域上的內容享有所有權,但同時要授予互聯網公司享有永久和免費的使用權。這一條款能夠確?;ヂ摼W上永遠有信息存在和不斷流通,即使用戶注銷其賬戶,也無權要求從服務器上徹底刪除全部個人活動和信息。這是兩權分離帶給互聯網的最大好處。同時,關于用戶隱私的約定,也僅限于那些能夠直接識別出用戶身份的基礎信息,對于能夠從用戶網絡行為中發掘出的大量有價值的數據,則無需用戶同意即可使用,這就為大數據分析掃清了法律障礙。
最后,從平臺提供商和第三方開發者的關系來看,也存在兩權分離的廣泛實踐,即第三方中小開發者作為外包的勞動力,可以免費使用平臺的API接口和某種特定類型的用戶信息,由此產生出的價值再和平臺提供商分成?!痘ヂ摼W周刊》主編姜奇平先生很早就看到了兩權分離作為新經濟模式的核心特征(姜奇平,2012)。然而,他始終強調的是這最后一點,卻沒有提及大量用戶在所謂“分享型經濟”中初級生產資料提供者的地位。再次回到前述觀點,用戶幫助互聯網戰勝了傳統利益群體,同時,也將自己牢牢捆綁在新經濟的機器上,通過集體行為像農民一樣不斷為領主生產食糧,或者更不恰當地,像蜜蜂一樣不斷為養蜂人生產蜂蜜。
大數據的法律障礙
至此可以看出,大數據革命的重要現實條件,是擁有海量數據的平臺出現,圍繞互聯網平臺及其封閉價值鏈,產生了一系列初級和次級的資產提供者。因此,圍繞數據資產的爭奪就成了互聯網治理中重要的爭論議題,我們由此可以理解,為什么谷歌聯合創始人會把蘋果公司和facebook同中國與好萊塢放在一起批評,因為它們都阻礙了數據在世界范圍內的自由流通,從而阻止其從中獲利(Katz, 2012)。我們同樣也可以理解互聯網公共領域的實質和局限,例如,盡管社交網絡允許人們迅速發布傳遞消息和真相,挑戰傳統權力和媒體,但社交媒體的架構,仍然從屬于商業化盈利的需求,進而影響甚至決定網絡言論和表達的效果。
未來的大數據發展面臨著一系列約束數據和信息流通的障礙,而互聯網巨頭一直要求打破這些障礙,解放各種信息,并在自己的勢力范圍內重組。中國目前和互聯網相關的法律,仍然是以原子時代的思維方式,一味依靠政治邏輯進行治理,而沒能夠從商業邏輯角度思考互聯網的本性,由此,不僅沒能有效規制互聯網產業的有序競爭,還影響了其他重要社會價值的實現。
在商業邏輯看來,約束個人信息流通的法律至為關鍵。隱私保護在中國的法律制度中一直處于灰色地帶,因為中國幅員遼闊,又處于從農業熟人社會向工商業陌生人社會的急劇轉變當中,很難統一人們對隱私權的認識和實踐?;ヂ摼W第一次用實踐強行統一了標準,即通過用戶協議將互聯網隱私界定為可以追溯和識別個人身份的基礎信息。無論用戶是否真正閱讀,這都是一種進步,它適應了信息技術的現實,取消了傳統的空間隱私權的地位,并承諾未經用戶許可不向第三方出售或轉讓用戶隱私。缺陷則在于,沒有賦予用戶對個人數據的控制權,加之大部分用戶對個人數據安全的無謂心態,都直接造成了個人信息無序搜集、買賣和盜竊的泛濫。
巨頭平臺的興起,對個人數據利用的混亂狀態可能是一個糾偏,允許第三方開發者有效有序地開發,卻默認了自身的合法性。如果中國未來的個人信息保護法像歐盟一樣嚴厲,那么很難設想現有的巨頭還會繼續存在。鑒于互聯網經濟的持續影響,基本上可以肯定中國不會效仿歐盟的實踐,而很可能進一步區分屬于人格權和基于空間形態的傳統隱私與更加中立的個人數據,從而為新經濟的發展保駕護航。消費者們也可能繼續擁護這個二分法,允許互聯網創新進一步發掘波蘭尼意義上的默會知識和情境知識,從而更好地滿足自身的需求(Weinberger, 2012)。而且,通過算法和機器對個人信息進行的分析與預測,似乎也不同于以往人為地侵犯個人尊嚴的行為,例如搜查和監視。
研究已經表明,即使經過匿名化處理的數據,仍然可以追溯至具體的個人,可見,以“是否能夠直接識別”為標準不足以保護用戶的隱私(Ohm, 2010)。更何況,用戶完全失去了對個人數據的控制,并不能知曉這些數據在未來能夠以何種方式被創造性地挖掘和利用。問題的實質,仍然在于用戶的自主選擇,在于他們是否有意愿自己掌控數據的流向與使用。對于掌握大數據的企業,同樣有必要對其使用用戶數據的行為進行監管,但無論如何,上述歷史,反映了互聯網企業如何通過用戶協議和隱私法律的模糊,利用用戶數據進行搜集和使用信息,而討論任何未來的法律,都不會實質性地損害到新經濟的根本。
版權法是阻礙大數據革命的另一個障礙。和隱私相似,如果版權法過于嚴格,則會影響依靠海量信息生存的互聯網發展。中國互聯網的歷史已經基本排除了這種可能性,作為一個整體的互聯網行業不會因為盜版的“原罪”而被摧毀,更何況它們正在努力漂白,不僅為自己的合法性宣傳,也為拓展業務同舊利益群體開展合作,通過更新的生產方式而游說立法者,試圖將法律體系按照它們的意愿重新塑造,例如網絡廣告、反壟斷、在線交易征稅、電子貨幣、投資結構等等。圍繞信息網絡傳播權展開的大量訴訟,都表明法律最終沒能解決盜版侵權問題,真正解決問題的毋寧是新舊利益之間的密切合作,互聯網產業真正做到了讓自己成為舊法律的“例外者”。
新經濟的一個更為長遠的意圖在于將我們日常生活的世界全部數字化,從而可以交由某一個先進的算法進行處理,當算法可資處理的數據足以反映人類社會最為基本的關系和行為的時候,真正意義上的人工智能就誕生了。但這個過程并非田園詩般美妙,而是伴隨著利益的爭斗和權力關系的消長。大數據革命是我們過去的互聯網時代的延續,而非某種“驚人的一躍”。塑造互聯網過去發展的商業模式和法律制度,仍將繼續影響未來大數據的實踐??梢灶A見的未來,將是互聯網產業進一步破除阻礙信息流通的種種障礙,獲取更多可分析的數據,并不斷從傳統法律保護的種種利益和價值中獲利。筆者認為,必須將勞動重新引入法律分析,因為傳統法律保護的利益在互聯網時代全都可以轉化為點滴的集體勞動,并可以成為贏利的資產,例如言論、隱私、版權和信息財產等,否則,我們就無法理解用戶在互聯網崛起過程中扮演的關鍵角色。
限于篇幅,本文無法討論數據挖掘和預測的工具(“算法”)的歷史及其社會效果,讀者可以參考兩本新近出版的著作進一步思考。(Sch?nberger & Cukier, 2013; Gitelman, 2013)
(作者單位:上海財經大學法學院)