從各種各樣類型的數據中,快速獲得有價值信息的能力,就是大數據技術。明白這一點至關重要,也正是這一點促使該技術具備走向眾多企業的潛力。大數據的4個“V”,或者說特點有四個層麵:第一,數據體量巨大。從TB級別,躍升到PB級別;第二,數據類型繁多。前文提到的網絡日誌、視頻、圖片、地理位置信息等等。第三,價值密度低。以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。第四,處理速度快。

VIP內容

來源:中國信息通信研究院

  曆經多年發展,大數據從一個新興的技術產業,正在成為融入經濟社會發展各領域的要素、資源、動力、觀念。

  近日,中國信息通信研究院正式發布《大數據白皮書(2021年)》。本白皮書以數據要素的價值釋放作為可信邏輯,重點探索大數據政策、法律、技術、管理、流通、安全等方麵的內容,並對“十四五”期間我國大數據的發展進行展望。

  2021年以來,全球各國大數據戰略持續推進,聚焦數據價值釋放,而國內圍繞數據要素的各個方麵正在加速布局和創新發展。

  政策方麵,我國大數據戰略進一步深化,激活數據要素潛能、加快數據要素市場化建設成為核心議題。

  “十四五”規劃全麵布局大數據發展,為今後五年大數據的發展作出了總體部署,為各部門各地方進行大數據專項規劃提供了重要依據。“十四五”規劃對於大數據發展的布局,可以概括為突出數據在數字經濟中的關鍵作用、加強數據要素市場規則建設、重視大數據相關基礎設施建設。其中包括將大數據作為數字經濟的重要“原料”,加強供給能力;針對數據要素市場目前麵臨的問題,提出加強規則;完善數據資源彙聚與流動的關鍵支撐底座,建設新興基礎設施。

  法律方麵,從基本法律、行業行政法規到地方立法,我國數據法律體係架構初步搭建完成。

  法律製度是數據要素市場化建設的重要保障。2021年我國數據立法取得突飛猛進的進展,備受關注的《數據安全法》和《個人信息保護法》先後出台,與《網絡安全法》共同形成了數據合規領域的“三駕馬車”,標誌著數據合規的法律構架已初步搭建完成。在此基礎上,重點行業、新興技術的法律和司法解釋在今年密集出台,地方性立法成果豐碩,為國家安全提供了有力的支撐,為產業、技術的發展提供了清晰的合規指引,也為人民提供了更全麵的權益保障。

  技術方麵,大數據技術體係以提升效率、賦能業務、加強安全、促進流通為目標加速向各領域擴散,已形成支撐數據要素發展的整套工具體係。

  2020年開始,隨著各行業數字化轉型的推進、數據安全事件的頻發,大數據技術的發展重點也從單一注重效率提升,演變為“效率提升、賦能業務、加強安全、促進流通”四者並重。其中。效率提升:利用雲原生思想進行能力升級;賦能業務:利用開發平台釋放業務潛能;加強安全:利用“零信任”不足內生安全;促進流通:利用隱私計算保障數據流通。

  管理方麵,數據資產管理實踐加速落地,並正在從提升數據資產質量向數據資產價值運營加速升級。

  隨著理論研究和行業實踐的不但深入發展,數據資產管理的目標正在由數據質量的提升逐步轉向數據價值的釋放,數據資產確權、估值等“老大難”問題也出現了落地方案,數據資產管理迎來新的發展階段。

  流通方麵,數據流通的基礎製度與市場規則仍在起步探索階段,但各界力量正在從新模式、新技術、新規則等多角度加速探索變革思路。

  數據流通是指以數據作為流通對象,按照一定規則從數據提供方法傳遞到數據需求方的過程,即數據資源先後被不同主體獲取、掌握或利用的過程。“數據要素市場市場化配置”提出後,各地繼續將設立數據交易機構作為促進數據要素流通的主要抓手,再次掀起建設熱潮。

  安全方麵,隨著監管力度和企業意識的強化,數據安全治理初見成效,數據安全的體係化建設逐步提升。

  麵對日益嚴峻的數據安全形勢,國家、行業、地方相繼出台多項數據安全法律法規,並接連開展相應的審查整治行動,國內數據安全進入強監管新階段。當前企業數據安全治理組織架構以多樣化形式呈現,基本確立了企業內部的數據安全管理責任體係。數據分類分級工作穩步推進,為精細化數據安全防控打下堅實基礎。數據安全風險評估逐漸深入各業務線,提升了潛在風險的防範化解能力。

  利用好數據要素是驅動數字經濟創新發展的重要抓手。“十四五”期間我國將立足新發展階段、貫徹新發展理念,進一步提升數字化發展水平,為數字經濟發展提供持久的新動力,進而為構建現代化經濟體係和新發展格局提供強大支撐。一是釋放數據價值將成為全球競爭戰略的重要組成部分;二是進一步發揮大數據技術在數據價值挖掘方麵的效用;三是數據治理製度體係與技術工具雙軌並進;四是新數據流通業態與政策製度協同創新;五是數據合規法律體係將進一步完善成熟。

成為VIP會員查看完整內容
2
65
0

最新論文

With the rapid development of big data, how to efficiently and accurately discover tight community structures in large-scale networks for knowledge discovery has attracted more and more attention. In this paper, a community detection framework based on Graph AutoEncoder Reconstruction (noted as GAER) is proposed for the first time. GAER is a highly scalable framework which does not require any prior information. We decompose the graph autoencoder-based one-step encoding into the two-stage encoding framework to adapt to the real-world big data system by reducing complexity from the original O(N^2) to O(N). At the same time, based on the advantages of GAER support module plug-and-play configuration and incremental community detection, we further propose a peer awareness based module for real-time large graphs, which can realize the new nodes community detection at a faster speed, and accelerate model inference with the 6.15 times - 14.03 times speed. Finally, we apply the GAER on multiple real-world datasets, including some large-scale networks. The experimental result verified that GAER has achieved the superior performance on almost all networks.

0
0
0
下載
預覽
微信掃碼谘詢專知VIP會員
Top