国产AV综合影院,色综合色综合色综合,色综合合久久天天综合绕视看

大數據發展遭遇瓶頸如何突破壁壘迎新生？

大數據發展遭遇瓶頸如何突破壁壘迎新生？ 2016年09月19日11:06 來源：中國智能制造網|

已經上升成為國家戰略，社會各界對大數據的期待上升到了前所未有的高度。如何務實推動大數據戰略落地，成為接下來的政策重點。

1、引言

2015年，我國《促進大數據發展行動綱要》出臺，十八屆五中全會進一步提出要在“十三五”期間實施國家大數據戰略，大數據一路上升成為國家戰略，社會各界對大數據的期待上升到了前所未有的高度。如何推動大數據戰略落地成為未來幾年的政策重點。本文重溫了大數據的內涵，分析了大數據的局限性，結合國內大數據發展面臨的瓶頸，提出了相關的策略建議。

2、把握概念本質，深刻認識大數據的戰略價值

大數據是新資源、新技術和新理念的綜合體。從資源視角來看，大數據是新資源，體現了一種全新的資源觀。摩爾定律仍然有效，計算存儲和傳輸數據的能力在以指數速度增長，分布式計算、存儲和數據技術的革新不斷涌現，互聯網企業對“數據廢氣”（DataExhaust）的挖掘利用大獲成功，引發全社會開始重新審視“數據廢氣”的價值，開始把數據當作一種獨特的戰略資源對待。

從技術視角看，大數據代表了新一代數據管理技術。傳統的數據管理與分析技術以數據為對象、在小數據集上進行分析、以集中式架構為主，成本高昂。與“貴族化”的數據分析技術相比，源于互聯網的，面向多源異構數據、在超大規模數據集上進行分析、以分布式架構為主的新一代數據管理技術與開源軟件潮流疊加，在大幅提高處理效率的同時（數據分析從T1到T0甚至實時），成百倍地降低了數據存儲和管理成本。底層技術的變革釋放了上層應用的創新活力。

從理念的視角看，大數據提供了一種全新的思維角度。大數據的應用，賦予了“實事求是”新的內涵，其一是“數據驅動”，即經營管理決策可以自下而上地由數據來驅動，甚至像量化股票交易、實時競價廣告等場景中那樣，可以由機器根據數據直接決策；其二是“數據閉環”，觀察互聯網行業大數據案例，它們往往能夠構造起包括數據采集、建模分析、效果評估到反饋修正各個環節在內的完整“數據閉環”，從而能夠不斷地自我升級，螺旋上升。

大數據本身既能形成新興產業，也能推動其他產業發展和社會進步，戰略重要性毋庸置疑。從狹義看，圍繞大數據采集、存儲、管理和挖掘，正在逐漸形成一個小的產業生態（狹義大數據產業）。2015年，全球的大數據產業規模約為200~300億美元。據中國信息通信研究院調查[1]，2015年我國大數據市場規模達到115.9億元，增速達38%，預計2016-2018年還將維持40%左右的高速增長。

從廣義看，大數據具有通用技術的屬性，能夠提升運作效率，提高決策水平，從而形成由數據驅動經濟發展的大生態。據華沙經濟研究所測算，歐盟27國因大數據的引進，至2020年將獲得1.9%的額外GDP增長[2]。美國麥肯錫預計到2020年美國大數據應用帶來的增加值將占2020年GDP的2%～4%。中國信息通信研究院采用華沙經濟研究所相同的模型測算，2014年大數據對我國GDP的增量貢獻約為0.53%～1.25%，2020年的增量貢獻最高將達到1.9%。大數據的應用對社會治理水平的提升也能起到明顯的推動作用。

3、避免盲目跟風，大數據熱潮還需冷思考

身處大數據熱潮中，既要充分認識大數據的潛力，積極把握技術進步帶來的機遇，也要認清大數據的局限性，警惕大數據萬能論。一些被廣泛傳播的經典案例現在被證明是子虛烏有的，比如，啤酒與尿布的故事實際上是Teradata公司的工程師ThomasBlischok在1992年杜撰的，從來沒發生過；而Netflix號稱用大數據分析幫助自制劇《紙牌屋》取得成功，而實際上是把大數據作為公關活動的噱頭。筆者認為，至少有以下幾點值得思考：

第一，大數據尚難對人的行為做出精確預測。在大數據是否能準確預測人類行為的問題上，還存在重大分歧。《黑天鵝》指出人類的行為不可預測，而《爆發》一書則根據對以往歷史經驗的總結，指出人類行為93%可預測。麻省理工學院教授羅伯特·萊格伯恩（RobertoRigobon）稱，雖然華爾街一直重視數據分析，但基于海量數據分析的對沖基金在全球都是失敗的。“對于人和事件，如果放到越大的空間和時間范圍，則是越可以精確預測的。如果放到越小的空間和時間范圍，則是越不可以精確預測的。例如，我們幾乎可以在100%的程度上預測一個人在24小時的時間范圍內會吃飯；但若精確到某一分鐘，則幾乎不可能預測準確。”大數據無法預測人類行為，歸根結底還是因為人具有“自由意志”，人會根據預測結果（如下個月的股票價格、明天的交通擁堵情況）改變自身行為，從而使得預測失效。

第二，大數據相關關系不能替代因果關系。舍恩伯格在《大數據時代》[9]中說：“我們沒有必要非得知道現象背后的原因，而是要讓數據自己發聲”，“相關關系能夠幫助我們更好地了解這個世界”。追尋相關關系和因果關系，是人類思維的兩種重要方式，而用大數據進行預測往往依靠相關性，也就是說，很多情況下知道“是什么”即可，不必知道“為什么”。相關關系的運用在互聯網推薦、精準廣告等方面得到了實際應用。然而，在很多時候，如疾病診斷、工廠故障分析等場景下，需要根據確定的（或置信度非常高的）結論來決策，僅憑相關關系是遠遠不夠的。換言之，大數據中的相關關系應用，需要區分場景，有時候數據無法自己說話，需要追本溯源。

第三，大數據來源不均衡會讓數據“說謊”。有人說數據不會撒謊。實際上，如果忽視數據來源的不均衡性，數據分析結果就會“騙人”。中國互聯中心2015年的統計數據顯示，我國網民城鄉分布嚴重不均，農村網民雖然迅猛增長，但仍不及城市新增網民數量的1/10。社交網絡用戶的性別分布也同樣有很嚴重的傾斜，騰訊公司2015年年初的報告顯示，微信用戶的男女比例為1.8:1，男性用戶約占了64.3%，而女性用戶則只有35.7%。如果利用網絡大數據進行民意調查，卻不把樣本分布的不均衡性考慮進去，就可能使得某些群體未得到充分代表，而某些群體因使用率高，其意見或特征被過分放大。這種不均勻的數據來源會導致分析結果存在偏見和盲區。

第四，大數據無法消滅信息不對稱現象。有人說，大數據有助于消滅信息不對稱。雖然從全社會看，大數據的全面采集和融合應用有望在局部緩和信息不對稱程度，但是在互聯網世界中，馬太效應很顯著，擁有大數據資源和掌握大數據分析能力的企業，往往會在大數據時代占據更加有利的地位、占有更多數據，從而更容易形成一批數據寡頭，產生新的不平等，造成新的信息不對稱。因此，大數據無法消滅信息不對稱，反而更有可能助推數據寡頭的出現。如果這種數據壟斷地位被企業濫用，將會威脅個人、企業甚至國家利益。因此，在大數據時代，如何進一步彌合數據鴻溝、防止數據“霸權”的濫用，將會成為一個重要的新課題。熱潮之下，對大數據的反思，還需要不斷深入，才能讓我們保持清醒的頭腦。

責任編輯：姚泓澤

上一頁1

久久综合给合久久狠狠狠97色69,婷婷五月综合丁香在线,综合激情五月综合激情五月激情1,青青热久久久久综合精品

大數據發展遭遇瓶頸 如何突破壁壘迎新生？

大數據發展遭遇瓶頸如何突破壁壘迎新生？