大數據發展遭遇瓶頸 如何突破壁壘迎新生?

大數據發展遭遇瓶頸 如何突破壁壘迎新生? 2016年09月19日11:06 來源:中國智能制造網|

   已經上升成為國家戰略,社會各界對大數據的期待上升到了前所未有的高度。如何務實推動大數據戰略落地,成為接下來的政策重點。

 1、引言

 2015年,我國《促進大數據發展行動綱要》出臺,十八屆五中全會進一步提出要在“十三五”期間實施國家大數據戰略,大數據一路上升成為國家戰略,社會各界對大數據的期待上升到了前所未有的高度。如何推動大數據戰略落地成為未來幾年的政策重點。本文重溫了大數據的內涵,分析了大數據的局限性,結合國內大數據發展面臨的瓶頸,提出了相關的策略建議。

 2、把握概念本質,深刻認識大數據的戰略價值

 大數據是新資源、新技術和新理念的綜合體。從資源視角來看,大數據是新資源,體現了一種全新的資源觀。摩爾定律仍然有效,計算存儲和傳輸數據的能力在以指數速度增長,分布式計算、存儲和數據技術的革新不斷涌現,互聯網企業對“數據廢氣”(DataExhaust)的挖掘利用大獲成功,引發全社會開始重新審視“數據廢氣”的價值,開始把數據當作一種獨特的戰略資源對待。

 從技術視角看,大數據代表了新一代數據管理技術。傳統的數據管理與分析技術以數據為對象、在小數據集上進行分析、以集中式架構為主,成本高昂。與“貴族化”的數據分析技術相比,源于互聯網的,面向多源異構數據、在超大規模數據集上進行分析、以分布式架構為主的新一代數據管理技術與開源軟件潮流疊加,在大幅提高處理效率的同時(數據分析從T1到T0甚至實時),成百倍地降低了數據存儲和管理成本。底層技術的變革釋放了上層應用的創新活力。

 從理念的視角看,大數據提供了一種全新的思維角度。大數據的應用,賦予了“實事求是”新的內涵,其一是“數據驅動”,即經營管理決策可以自下而上地由數據來驅動,甚至像量化股票交易、實時競價廣告等場景中那樣,可以由機器根據數據直接決策;其二是“數據閉環”,觀察互聯網行業大數據案例,它們往往能夠構造起包括數據采集、建模分析、效果評估到反饋修正各個環節在內的完整“數據閉環”,從而能夠不斷地自我升級,螺旋上升。

 大數據本身既能形成新興產業,也能推動其他產業發展和社會進步,戰略重要性毋庸置疑。從狹義看,圍繞大數據采集、存儲、管理和挖掘,正在逐漸形成一個小的產業生態(狹義大數據產業)。2015年,全球的大數據產業規模約為200~300億美元。據中國信息通信研究院調查[1],2015年我國大數據市場規模達到115.9億元,增速達38%,預計2016-2018年還將維持40%左右的高速增長。

 從廣義看,大數據具有通用技術的屬性,能夠提升運作效率,提高決策水平,從而形成由數據驅動經濟發展的大生態。據華沙經濟研究所測算,歐盟27國因大數據的引進,至2020年將獲得1.9%的額外GDP增長[2]。美國麥肯錫預計到2020年美國大數據應用帶來的增加值將占2020年GDP的2%~4%。中國信息通信研究院采用華沙經濟研究所相同的模型測算,2014年大數據對我國GDP的增量貢獻約為0.53%~1.25%,2020年的增量貢獻最高將達到1.9%。大數據的應用對社會治理水平的提升也能起到明顯的推動作用。

 3、避免盲目跟風,大數據熱潮還需冷思考

 身處大數據熱潮中,既要充分認識大數據的潛力,積極把握技術進步帶來的機遇,也要認清大數據的局限性,警惕大數據萬能論。一些被廣泛傳播的經典案例現在被證明是子虛烏有的,比如,啤酒與尿布的故事實際上是Teradata公司的工程師ThomasBlischok在1992年杜撰的,從來沒發生過;而Netflix號稱用大數據分析幫助自制劇《紙牌屋》取得成功,而實際上是把大數據作為公關活動的噱頭。筆者認為,至少有以下幾點值得思考:

 第一,大數據尚難對人的行為做出精確預測。在大數據是否能準確預測人類行為的問題上,還存在重大分歧。《黑天鵝》指出人類的行為不可預測,而《爆發》一書則根據對以往歷史經驗的總結,指出人類行為93%可預測。麻省理工學院教授羅伯特·萊格伯恩(RobertoRigobon)稱,雖然華爾街一直重視數據分析,但基于海量數據分析的對沖基金在全球都是失敗的。“對于人和事件,如果放到越大的空間和時間范圍,則是越可以精確預測的。如果放到越小的空間和時間范圍,則是越不可以精確預測的。例如,我們幾乎可以在100%的程度上預測一個人在24小時的時間范圍內會吃飯;但若精確到某一分鐘,則幾乎不可能預測準確。”大數據無法預測人類行為,歸根結底還是因為人具有“自由意志”,人會根據預測結果(如下個月的股票價格、明天的交通擁堵情況)改變自身行為,從而使得預測失效。

 第二,大數據相關關系不能替代因果關系。舍恩伯格在《大數據時代》[9]中說:“我們沒有必要非得知道現象背后的原因,而是要讓數據自己發聲”,“相關關系能夠幫助我們更好地了解這個世界”。追尋相關關系和因果關系,是人類思維的兩種重要方式,而用大數據進行預測往往依靠相關性,也就是說,很多情況下知道“是什么”即可,不必知道“為什么”。相關關系的運用在互聯網推薦、精準廣告等方面得到了實際應用。然而,在很多時候,如疾病診斷、工廠故障分析等場景下,需要根據確定的(或置信度非常高的)結論來決策,僅憑相關關系是遠遠不夠的。換言之,大數據中的相關關系應用,需要區分場景,有時候數據無法自己說話,需要追本溯源。

 第三,大數據來源不均衡會讓數據“說謊”。有人說數據不會撒謊。實際上,如果忽視數據來源的不均衡性,數據分析結果就會“騙人”。中國互聯中心2015年的統計數據顯示,我國網民城鄉分布嚴重不均,農村網民雖然迅猛增長,但仍不及城市新增網民數量的1/10。社交網絡用戶的性別分布也同樣有很嚴重的傾斜,騰訊公司2015年年初的報告顯示,微信用戶的男女比例為1.8:1,男性用戶約占了64.3%,而女性用戶則只有35.7%。如果利用網絡大數據進行民意調查,卻不把樣本分布的不均衡性考慮進去,就可能使得某些群體未得到充分代表,而某些群體因使用率高,其意見或特征被過分放大。這種不均勻的數據來源會導致分析結果存在偏見和盲區。

 第四,大數據無法消滅信息不對稱現象。有人說,大數據有助于消滅信息不對稱。雖然從全社會看,大數據的全面采集和融合應用有望在局部緩和信息不對稱程度,但是在互聯網世界中,馬太效應很顯著,擁有大數據資源和掌握大數據分析能力的企業,往往會在大數據時代占據更加有利的地位、占有更多數據,從而更容易形成一批數據寡頭,產生新的不平等,造成新的信息不對稱。因此,大數據無法消滅信息不對稱,反而更有可能助推數據寡頭的出現。如果這種數據壟斷地位被企業濫用,將會威脅個人、企業甚至國家利益。因此,在大數據時代,如何進一步彌合數據鴻溝、防止數據“霸權”的濫用,將會成為一個重要的新課題。熱潮之下,對大數據的反思,還需要不斷深入,才能讓我們保持清醒的頭腦。

責任編輯:姚泓澤

上一頁1

主站蜘蛛池模板: 亚洲综合精品网站在线观看| 伊人色综合网一区二区三区| 久久天堂av综合色无码专区| 国产成人亚洲综合色影视| 亚洲AV综合色一区二区三区| 婷婷综合久久中文字幕蜜桃三电影| 狠狠做深爱婷婷综合一区| 伊人激情久久综合中文字幕| 久久综合五月婷婷| 国产精品综合在线| 亚洲国产综合专区电影在线| 亚洲人成网站999久久久综合 | 亚洲综合精品香蕉久久网97| 国产成+人+综合+亚洲专| 激情婷婷成人亚洲综合| 伊人激情久久综合中文字幕| 亚洲a∨国产av综合av下载| 久久综合亚洲色HEZYO国产| 天天干天天色综合| 97se亚洲综合在线| av一本久道久久综合久久鬼色| 久久综合88熟人妻| 狠狠色综合网站久久久久久久高清| 亚洲小说图区综合在线| 中文字幕亚洲综合久久综合| 久久综合狠狠色综合伊人| 区三区激情福利综合中文字幕在线一区亚洲视频1 | 亚洲国产成人久久综合碰碰动漫3d| 在线综合亚洲欧洲综合网站| 香蕉蕉亚亚洲aav综合| 久久乐国产精品亚洲综合| 亚洲免费综合色在线视频| 亚洲综合一区二区| 亚洲国产精品综合久久久| 亚洲av综合色区| 亚洲综合视频在线| 国产91色综合久久免费| 亚洲色偷偷综合亚洲av78 | 久久久久久久综合| 亚洲国产精品综合久久网各| 中文字幕亚洲综合久久综合|