2015年,我國提出實施國家大數(shù)據戰(zhàn)略。2017年,習近平總書記在中共中央政治局第二次集體學習時強調,要瞄準世界科技前沿,集中優(yōu)勢資源突破大數(shù)據核心技術,加快構建自主可控的大數(shù)據產業(yè)鏈、價值鏈和生態(tài)系統(tǒng),以數(shù)據為紐帶促進產學研深度融合,形成數(shù)據驅動型創(chuàng)新體系和發(fā)展模式,培育造就一批大數(shù)據領軍企業(yè),打造多層次、多類型的大數(shù)據人才隊伍。
信息化發(fā)展新階段,開啟數(shù)字經濟和數(shù)字社會新篇章
數(shù)據是人類社會發(fā)展的忠實記錄者,它的獲取、處理與應用在人類社會發(fā)展中一直扮演著重要角色。互聯(lián)網快速發(fā)展帶來無處不在的信息技術應用,海量數(shù)據隨著這一進程不斷產生,蘊含著巨大的社會、經濟、科研價值,成為繼物質、能源之后的第三大戰(zhàn)略資源,急需重新審視和發(fā)展。信息技術的發(fā)展為數(shù)據處理提供了自動化方法和手段,“大數(shù)據”概念應運而生。
大數(shù)據并不是近幾年才誕生的新奇詞語。從抽象概念到科學研究,再到各領域應用,大數(shù)據技術正進入新的高速發(fā)展階段。
1998年,美國科學家約翰·馬西在一份國際會議報告中指出:隨著數(shù)據量快速增長,必將出現(xiàn)數(shù)據難理解、難獲取、難處理和難組織四個難題,并用“大數(shù)據”來描述這一挑戰(zhàn)。2007年,數(shù)據庫領域先驅人物吉姆·格雷指出,大數(shù)據將成為人類觸摸、理解和逼近現(xiàn)實復雜系統(tǒng)的有效途徑。“數(shù)據+計算機+算法模型”的方法借助大數(shù)據,為人類探索客觀世界提供了繼實驗觀測、理論推導、計算仿真后的第四種手段。
如果說大數(shù)據概念興起的這兩個節(jié)點,還局限于科技創(chuàng)新前沿領域,那么以2012年一本書的暢銷為標志,大數(shù)據概念“飛入尋常百姓家”。這一年,牛津大學教授維克托·邁爾—舍恩伯格在其著作《大數(shù)據時代:生活、工作與思維的大變革》中指出,數(shù)據分析將從“隨機采樣”“精確求解”“強調因果”的傳統(tǒng)模式演變?yōu)榇髷?shù)據時代的“全體數(shù)據”“近似求解”“只看關聯(lián)不問因果”的新模式。
究竟什么是大數(shù)據?目前的共識是,大數(shù)據泛指無法在可容忍的時間內用傳統(tǒng)信息技術和軟硬件工具進行感知、獲取、管理、處理和服務的巨量數(shù)據集合,具有數(shù)據規(guī)模大、來源豐富、類型復雜、變化迅速等諸多特征。大數(shù)據技術本質是提供一種人類認識復雜系統(tǒng)的新思維和新手段。大數(shù)據時代的到來,標志信息化跨越以單機應用為特征的數(shù)字化階段、以互聯(lián)網應用為特征的網絡化階段,正式進入以數(shù)據深度挖掘與融合應用為特征的智慧化階段。
大數(shù)據開啟的信息化新階段,代表新一代信息技術的全新應用,孕育出以數(shù)據為主要生產要素、繼農業(yè)經濟和工業(yè)經濟之后更高級的經濟形態(tài)——數(shù)字經濟,全球加速步入數(shù)字社會。在數(shù)字經濟和數(shù)字社會中,數(shù)據是新型生產資料,云計算、物聯(lián)網和5G是新型生產工具,人工智能是新型生產力,區(qū)塊鏈則是解決互聯(lián)網生產關系中數(shù)據難以開放共享的新型生產關系。大數(shù)據以及新一代信息技術最終的應用形態(tài)表現(xiàn)為軟件,因此,軟件定義也被視為數(shù)字經濟和數(shù)字社會的新型生產方式。
提升國家治理現(xiàn)代化水平,大數(shù)據應用觸手可及
大數(shù)據已受到許多國家、許多行業(yè)的高度重視。如果能有效組織和使用大數(shù)據,將對社會經濟、科學研究、國家治理等產生巨大推動作用,孕育著前所未有的機遇。我國在運用大數(shù)據提升國家治理現(xiàn)代化水平、保障和改善民生方面取得巨大進展和成效。
雖然聽起來有些抽象,但大數(shù)據離我們的日常生活并不遙遠。比如北京、浙江等部分地區(qū)應用大數(shù)據簡化群眾辦事流程、優(yōu)化辦事體驗、提升辦事效率,從原來“來回跑”到現(xiàn)在“最多跑一次”和“一次都不跑”,實現(xiàn)“數(shù)據多跑路、群眾少跑腿”。北京、上海、浙江、廣東、貴州等地紛紛成立省級大數(shù)據局,全面推動電子政務和智慧城市建設向大數(shù)據轉型和升級,深刻改變城市管理的認知方式、思維方式、工作方式以及協(xié)作方式。大數(shù)據是城市智慧運行的“好幫手”,各地紛紛建設“城市大腦”,通過數(shù)據提供全局態(tài)勢感知、定量分析研判、科學智能決策的技術支持,讓決策統(tǒng)一到“一張底圖和多個圖層”上來,掛圖指揮、科學決策、閉環(huán)提升,逐步實現(xiàn)“像繡花一樣”管理城市。
一般來說,各類大數(shù)據分析應用可分為三個層次。第一層是描述性分析應用,是指從大數(shù)據中總結、抽取相關信息和知識,幫助人們分析發(fā)生了什么,并呈現(xiàn)事物發(fā)展歷程。比如,新冠肺炎疫情防控中的大數(shù)據應用基本上都屬于這一類:社區(qū)管控有“健康碼”,基層防控有“密切接觸者測量儀”,復工復產有“三色碼”,還有移動通信運營商14天機主活動軌跡數(shù)據查詢等。可以說,大數(shù)據技術成為新冠肺炎疫情防控重要科技手段之一。
第二層是預測性分析應用,是指從大數(shù)據中分析事物之間關聯(lián)關系、發(fā)展模式等,并據此預測事物發(fā)展趨勢。仍以新冠肺炎疫情防控為例,通過融合運營商和互聯(lián)網公司位置數(shù)據,可以定量支持人口流向趨勢分析與研判,便于預測發(fā)展趨勢、分析區(qū)域風險、實現(xiàn)精準防控。
第三層是決策性分析應用,是指在前兩個層次基礎上,分析不同決策的效果,并對決策進行指導和優(yōu)化。決策性分析強調因果關系,不僅要“知其然”,還要“知其所以然”。例如,大數(shù)據與流行病學有機結合,在宏觀的、總體趨勢的研判基礎上,進一步精準預估高風險區(qū)域、高風險人員數(shù)量,為醫(yī)療資源、物資、防控措施等提供更為科學、精準的決策依據。
大數(shù)據基礎設施建設未來可期
經過近幾年積極探索和實踐,我國在大數(shù)據技術、產業(yè)、應用等各方面都取得顯著進展。同時,大數(shù)據和人工智能、區(qū)塊鏈、物聯(lián)網等新一代信息技術融合,開拓出更大進步空間。其中,在自主創(chuàng)新研發(fā)方面也取得不小進展。我們需要進一步加強自主研發(fā),尤其是集中資源建設自主創(chuàng)新的底層技術開源平臺。
不久前召開的中央政治局常委會會議強調,加快5G網絡、數(shù)據中心等新型基礎設施建設進度。與傳統(tǒng)基礎設施建設相比,新型基礎設施建設側重突出產業(yè)轉型升級新方向。以大數(shù)據為代表,“新基建”體現(xiàn)出加快推進產業(yè)高端化發(fā)展大趨勢。大數(shù)據技術研發(fā)人員應該抓住機遇,做好新技術融合功課,賦能“新基建”建設。
大數(shù)據是全球數(shù)字化、網絡化與智能化浪潮的重要代表性技術之一。我們的工作方式、生活方式、連接方式、協(xié)作方式或將被改變、被優(yōu)化、被完善,我們每一個人都將成為其中一分子,成為數(shù)字社會的親歷者、見證者和建設者。(作者為北京大學人工智能研究院教授)