中國信通院何寶宏:下一代數(shù)據(jù)治理體系架構基本形成,呈現(xiàn)6大趨勢

12月18日消息(水易)今日,在以“數(shù)據(jù)重塑價值 智能鏈接未來”為主題的“2024數(shù)據(jù)資產(chǎn)管理大會”期間,中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏發(fā)表了題為《下一代數(shù)據(jù)治理》的演講。

數(shù)據(jù)治理能力建設迫在眉睫

據(jù)統(tǒng)計2023年我國數(shù)據(jù)生產(chǎn)總量達到了32.85ZB,同比增長高達22.44%,數(shù)據(jù)產(chǎn)業(yè)規(guī)模已達2萬億元。政策方面,國家高度重視數(shù)據(jù)產(chǎn)業(yè)發(fā)展,2020年以來陸續(xù)出臺了10多項政策文件,覆蓋數(shù)據(jù)基礎制度、數(shù)據(jù)整合利用、數(shù)據(jù)基礎設施與數(shù)據(jù)管理能力建設。

政策和企業(yè)自身數(shù)字化轉(zhuǎn)型需求推動數(shù)據(jù)管理能力不斷提升,數(shù)據(jù)治理需求愈發(fā)旺盛。同時,隨著國家數(shù)據(jù)局和各級數(shù)據(jù)管理機構的揭牌運行,我國上下聯(lián)動、橫向協(xié)同的數(shù)據(jù)工作體系基本形成,數(shù)據(jù)要素相關的政策布局思路也日漸明確。

何寶宏表示,“如何確保數(shù)據(jù)供得出、流得動、用得好,更好發(fā)揮數(shù)據(jù)要素作用”成為了數(shù)據(jù)要素發(fā)展的核心主線。數(shù)據(jù)的跨主體流轉(zhuǎn)和使用依賴于企業(yè)的數(shù)據(jù)治理能力,跨主體數(shù)據(jù)標準、數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全體系的建設迫在眉睫。

與此同時,以大模型為代表的強人工智能應用正在對社會各界產(chǎn)生顛覆式的變革,對科技、金融、醫(yī)療健康等各個領域產(chǎn)生了深遠的影響。

通用人工智能的發(fā)展,離不開數(shù)據(jù)的支持,大模型使得數(shù)據(jù)與算法的邊界更加模糊,數(shù)據(jù)嵌入到了模型的生成中,數(shù)據(jù)質(zhì)量與安全直接影響模型結果,面向人工智能開展數(shù)據(jù)治理成為了企業(yè)關注的新課題。另外,在人工智能技術的加持下,Text to SQL、ChatBI、智能化數(shù)據(jù)治理等應用百花齊放,數(shù)據(jù)治理開始由勞動密集型工作向自動化、智能化轉(zhuǎn)變。

何寶宏指出,隨著數(shù)據(jù)要素市場的蓬勃發(fā)展和人工智能技術的快速迭代,企業(yè)數(shù)據(jù)治理面臨管理效能、人員協(xié)同、多模數(shù)據(jù)管理、高質(zhì)量數(shù)據(jù)集建設等挑戰(zhàn),急需新的方法和技術來應對,下一代數(shù)據(jù)治理體系應運而生。

下一代數(shù)據(jù)治理體系架構基本形成

何寶宏介紹,在產(chǎn)業(yè)各方的協(xié)同下,下一代數(shù)據(jù)治理體系架構已經(jīng)已基本形成,總體呈現(xiàn)出治理對象全域化、研發(fā)模式工程化、治理技術智能化、數(shù)據(jù)架構分布式、數(shù)據(jù)安全縱深化、數(shù)據(jù)管理價值化六大趨勢。

趨勢一全域數(shù)據(jù)治理。全域的數(shù)據(jù)治理涵蓋了結構化數(shù)據(jù)與非結構化數(shù)據(jù)。人工智能已經(jīng)從“卷算法”向“卷數(shù)據(jù)”轉(zhuǎn)變,通過對訓練數(shù)據(jù)開展治理,從而形成可信的訓練數(shù)據(jù)集是人工智能發(fā)展的必然選擇。通過關注對非結構化數(shù)據(jù)的治理、合成數(shù)據(jù)的治理,研究配套的的方法論體系、技術平臺以及標準規(guī)范,進而形成質(zhì)量高、安全牢、觀點正的可信數(shù)據(jù)集。

中國信通院依托大數(shù)據(jù)技術標準推進委員會,發(fā)布業(yè)界首本《面向人工智能的數(shù)據(jù)治理實踐指南(1.0)》。同時,圍繞非結構化數(shù)據(jù)管理、合成數(shù)據(jù)等方向,TC601還在持續(xù)開展研究和標準化工作,推動我國數(shù)據(jù)治理工作向全域化發(fā)展。

趨勢二數(shù)據(jù)研發(fā)模式工程化、敏捷化。數(shù)據(jù)驅(qū)動時代,業(yè)務需求快速變化,數(shù)據(jù)處理流程紛繁復雜,企業(yè)必須處理好旺盛數(shù)據(jù)需求與數(shù)據(jù)生產(chǎn)力不足之間的矛盾,革新數(shù)據(jù)開發(fā)流程,加大數(shù)據(jù)供給力度,從而更好地響應需求、賦能業(yè)務發(fā)展。

DataOps是一種新的數(shù)據(jù)開發(fā)模式,通過構建高效協(xié)同機制,建立精細化數(shù)據(jù)運營體系,打造規(guī)范化、一體化的數(shù)據(jù)開發(fā)流程,實現(xiàn)數(shù)據(jù)產(chǎn)品高質(zhì)量與高效率地交付。

依托DataOps標準,中國信通院開展了DataOps能力評估,已經(jīng)在移動、聯(lián)通、農(nóng)行、工行等十多家機構落地,以評促建,幫助企業(yè)構建敏捷、精益地數(shù)據(jù)工程能力。未來,工作組還將結合各行業(yè)特征開展多個行業(yè)標準的制定,圍繞全域數(shù)據(jù)工程體系開展理論研究、標準研制工作,為社會發(fā)布最新的研究成果。

趨勢三數(shù)據(jù)治理技術智能化。據(jù)觀察,企業(yè)中的數(shù)據(jù)治理是勞動密集型工作?!爸悄芑瘮?shù)據(jù)治理”旨在借助人工智能技術手段開展數(shù)據(jù)治理工作,利用智能化技術在語義理解、邏輯推理、智能生成等方面的優(yōu)勢,幫助企業(yè)優(yōu)化治理流程,提升治理效率及效果。

中國信通院認為,未來“數(shù)據(jù)治理Agent”將是智能化數(shù)據(jù)治理成熟形態(tài)。一是具備靈活的適應性,可以通過外部接口靈活響應外部監(jiān)管要求。二是以任務落地為導向,幫助企業(yè)實現(xiàn)治理動作智能化實施。三是可通過對企業(yè)知識庫的學習對企業(yè)偏好形成認知,并通過反饋不斷優(yōu)化治理方案規(guī)劃,幫助企業(yè)智能決策。

趨勢四數(shù)據(jù)架構分布式化。企業(yè)數(shù)據(jù)架構管理以企業(yè)內(nèi)所有數(shù)據(jù)為管理對象,對數(shù)據(jù)的靜態(tài)結構和動態(tài)特性進行管理,對數(shù)據(jù)的定義、分布、集成、整合等進行規(guī)劃、管控和應用,確保數(shù)據(jù)與業(yè)務需求保持一致。

數(shù)據(jù)編織是一種分布式數(shù)據(jù)管理的架構理念,支持對數(shù)據(jù)跨平臺、跨域的靈活集成。采用邏輯集中、物理分散的管理方式,實現(xiàn)在正確的時間,從任意位置,將正確的數(shù)據(jù)與正確的人連接起來的終極目標。數(shù)據(jù)編織有以下特點:一是適配多源異構的數(shù)據(jù)來源;二是具備非常巨大的數(shù)據(jù)存儲容量;三是采用分布式的數(shù)據(jù)管理架構;四是支持AI協(xié)同的自動化能力。

另外,數(shù)據(jù)編織還可以作為企業(yè)數(shù)據(jù)空間的底層技術,實現(xiàn)多主體數(shù)據(jù)的邏輯統(tǒng)一管理。依托大數(shù)據(jù)技術標準推進委員會,國內(nèi)數(shù)據(jù)編織的理論研究、技術標準制定等工作已經(jīng)陸續(xù)開展。未來還將進一步聯(lián)合各界的專家學者共同完善數(shù)據(jù)編織的理論體系、標準體系以及標準驗證工作。

趨勢五數(shù)據(jù)安全縱深化。隨著三法兩條例的發(fā)布實施,我國數(shù)據(jù)安全治理體系已經(jīng)基本完善,企業(yè)數(shù)據(jù)安全能力建設從體系建設向場景化建設發(fā)展,數(shù)據(jù)分類分級、數(shù)據(jù)安全風險評估等工作正在如火如荼地開展。

另外,人工智能的發(fā)展給數(shù)據(jù)安全帶來了新的機遇與挑戰(zhàn)。一方面,人工智能技術的蓬勃發(fā)展,為數(shù)據(jù)安全領域帶來了前所未有的機遇。另一方面,數(shù)據(jù)作為大模型訓練的重要燃料,在模型生成、訓練、精調(diào)等過程面臨數(shù)據(jù)竊取、數(shù)據(jù)泄露、數(shù)據(jù)篡改等一系列數(shù)據(jù)安全風險。

趨勢六數(shù)據(jù)管理價值化。在數(shù)據(jù)要素政策逐步完善、數(shù)據(jù)交易市場日趨成熟的背景下,企業(yè)以釋放數(shù)據(jù)價值為導向開展數(shù)據(jù)資產(chǎn)化路徑探索,量化數(shù)據(jù)資產(chǎn)、賦能業(yè)務價值、預期經(jīng)濟收益,明確數(shù)據(jù)資源入表流程、成本核算機制,推動數(shù)據(jù)從資源化階段向資產(chǎn)化階段發(fā)展,充分釋放數(shù)據(jù)資產(chǎn)價值。

2024年是數(shù)據(jù)資源估值和入表的“元年”,中國信通院和中國聯(lián)通集團合作了“數(shù)據(jù)要素價值管理與實踐”研究報告,從成本投入、內(nèi)部收益、外部收益全面評估了數(shù)據(jù)價值,指導企業(yè)進一步深化數(shù)據(jù)應用、優(yōu)化數(shù)據(jù)管理模式。

數(shù)據(jù)入表方面,截至到今年第三季度,已有50多家企業(yè)入表,累計入表金額超過15億元,其中三大運營商入表規(guī)模占比很高,也是央企中率先開展入表披露的企業(yè)。

數(shù)據(jù)交易流通方面,場內(nèi)數(shù)據(jù)交易日趨規(guī)范,場外流通依然活躍。企業(yè)也在構建更多對外能力,比如建行的產(chǎn)融平臺、中國電信集團的“星海”大數(shù)據(jù)品牌都已良好運營,全力向數(shù)據(jù)要素型企業(yè)轉(zhuǎn)型升級。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2024-12-18
中國信通院何寶宏:下一代數(shù)據(jù)治理體系架構基本形成,呈現(xiàn)6大趨勢
中國信通院何寶宏:下一代數(shù)據(jù)治理體系架構基本形成,呈現(xiàn)6大趨勢,C114訊 12月18日消息(水易)今日,在以“數(shù)據(jù)重塑價值 智能鏈接未來”為主題的“2024數(shù)據(jù)資

長按掃碼 閱讀全文