鄔賀銓:建設可信數(shù)據(jù)空間 開發(fā)網(wǎng)絡數(shù)據(jù)資源
近日,中國互聯(lián)網(wǎng)絡信息中心聯(lián)合中國科學院計算機網(wǎng)絡信息中心、中國互聯(lián)網(wǎng)協(xié)會共同主辦的2024(第五屆)中國互聯(lián)網(wǎng)基礎資源大會在京召開。中國工程院院士鄔賀銓受邀出席并發(fā)表題為“建設可信數(shù)據(jù)空間 開發(fā)網(wǎng)絡數(shù)據(jù)資源”的主旨演講。鄔賀銓院士圍繞數(shù)據(jù)要素在推動高質量發(fā)展中的關鍵作用,深入探討了人工智能、數(shù)據(jù)基礎設施、數(shù)據(jù)資源管理與應用等多個話題。
以下為鄔賀銓院士演講內(nèi)容,經(jīng)整理發(fā)布
人工智能大模型正在從傳統(tǒng)語言模型向場景模型、多模態(tài)模型及推理模型發(fā)展。智能體是人工智能發(fā)展的重要應用,可以分解任務,具有形成思維鏈、記憶及調(diào)用工具等能力,是人工智能與物理實體結合的橋梁。
數(shù)據(jù)資源是重要的生產(chǎn)要素,可信數(shù)據(jù)空間是解決數(shù)據(jù)融合和數(shù)據(jù)安全問題的有效方法,支持跨境數(shù)據(jù)管理,提供數(shù)據(jù)源的認證、接入者身份認證、數(shù)據(jù)目錄檢索、敏感數(shù)據(jù)過濾、格式轉換等功能。
AI時代擴展了數(shù)字資源的管理范疇,數(shù)據(jù)安全管理變得尤為重要,需要建立相關企業(yè)之間的網(wǎng)絡安全威脅情報共享機制,提高數(shù)據(jù)存儲的安全性。
建設可信數(shù)據(jù)空間、開發(fā)網(wǎng)絡數(shù)據(jù)資源是當前的重要任務之一。我們需要推動人工智能技術的創(chuàng)新和應用,加強數(shù)據(jù)資源的管理和開發(fā),以支持數(shù)字經(jīng)濟的發(fā)展。
一是數(shù)據(jù)要素與人工智能的融合發(fā)展
鄔賀銓院士指出,當前人工智能已成為推動經(jīng)濟社會發(fā)展的重要力量,而數(shù)據(jù)則是人工智能發(fā)展的核心要素。隨著基礎大模型的廣泛應用,人工智能正在從傳統(tǒng)的語言大模型向場景大模型、多模態(tài)模型乃至推理模型發(fā)展。這些模型的上云和終端應用,不僅降低了企業(yè)使用大模型的門檻,還推動了數(shù)字化轉型的深入發(fā)展。
鄔賀銓院士強調(diào),盡管基礎大模型在行業(yè)中的直接應用有限,但通過加入行業(yè)數(shù)據(jù)進行訓練,可以優(yōu)化為行業(yè)大模型,進而在供應鏈、市場營銷、智能客服等領域展現(xiàn)出巨大的應用潛力。同時,智能體作為人工智能的重要應用形式,通過任務分解、推理能力、外部工具調(diào)用等功能,為數(shù)據(jù)資源增加了新的場景和價值。
二是數(shù)據(jù)基礎設施的建設與升級
數(shù)據(jù)基礎設施是數(shù)字基礎設施的重要組成部分,對于推動數(shù)據(jù)要素的高質量發(fā)展具有關鍵作用。鄔賀銓院士指出,隨著數(shù)據(jù)的爆發(fā)式增長,傳統(tǒng)的網(wǎng)絡設施已難以滿足數(shù)據(jù)流通和利用的需求。因此,必須加快數(shù)據(jù)基礎設施的建設和升級,包括算力設施、數(shù)據(jù)流通利用設施等。
在算力設施方面,鄔賀銓院士強調(diào),隨著云邊端協(xié)同和異構算力的發(fā)展,算力、存力、運力和網(wǎng)絡資源的可調(diào)度性成為關鍵。同時,元數(shù)據(jù)的統(tǒng)一注冊和尋址標準也對數(shù)據(jù)的訪問和管理至關重要。在數(shù)據(jù)流通利用設施方面,則需要加強算力調(diào)度、算力檢測、數(shù)據(jù)融合和安全等方面的功能實體建設,以支持數(shù)據(jù)的高效流通和利用。
三是數(shù)據(jù)資源的管理與應用
數(shù)據(jù)資源是數(shù)據(jù)要素的核心組成部分,對于推動高質量發(fā)展具有重要意義。然而,當前中國數(shù)據(jù)資源的存儲和開放比例較低,且存在數(shù)據(jù)標注難度大、數(shù)據(jù)開放與隱私保護挑戰(zhàn)等問題。為此,鄔賀銓院士提出了一系列針對性解決方案。
首先,在數(shù)據(jù)標注方面,應探索運用人工智能技術輔助數(shù)據(jù)標注,提高標注效率和準確性。同時,對人工智能生成的數(shù)據(jù)進行水印標記,以提升數(shù)據(jù)來源的可追溯性和可信度。其次,在公共數(shù)據(jù)開放與隱私保護方面,政府掌握大量數(shù)據(jù)資源但開放共享時需要進行去標識化處理,以保障個人隱私。對于跨境數(shù)據(jù)流動,則需實現(xiàn)匿名化以防止用戶敏感信息泄露。此外,還應限制對數(shù)據(jù)的非法訪問,通過IPv6等技術手段實現(xiàn)路徑溯源和數(shù)據(jù)流動的可控性。
在數(shù)據(jù)資源的應用方面,應推動AI上云、向終端下沉,將智能體嵌入物理實體。通過模型即服務(MaaS)等平臺,企業(yè)可以在云端微調(diào)自身數(shù)據(jù)并應用大模型,推動數(shù)字化轉型。同時,終端設備的升級也實現(xiàn)了嵌入大模型的能力,提升了設備的空間計算能力和隱私保護水平。
四是可信數(shù)據(jù)空間與數(shù)據(jù)可控共享
可信數(shù)據(jù)空間是保障數(shù)據(jù)安全與可控共享的重要手段??梢酝ㄟ^構建可信數(shù)據(jù)空間實現(xiàn)數(shù)據(jù)加密存儲與管理,確保數(shù)據(jù)可用但不可見。在垂直行業(yè)企業(yè)和IT企業(yè)的合作中,可信數(shù)據(jù)空間可以讓IT企業(yè)在封閉的可信空間內(nèi)對數(shù)據(jù)進行開發(fā)與計算,從而保障數(shù)據(jù)安全。
同時,可信數(shù)據(jù)空間還可以支持跨境數(shù)據(jù)流動的管理。通過加密存儲和遠程修改密鑰等手段,數(shù)據(jù)提供方可以確保數(shù)據(jù)在跨境傳輸和使用過程中的可控性和合規(guī)性。此外,可信數(shù)據(jù)空間還可以提供數(shù)據(jù)挖掘工具軟件、安全加密計算等同態(tài)加密計算支持以及交易清算結算服務等功能,為數(shù)據(jù)資源的全面應用提供有力保障。
五是網(wǎng)絡安全與數(shù)據(jù)保護
網(wǎng)絡安全是數(shù)據(jù)要素高質量發(fā)展的重要保障。當前許多企業(yè)在數(shù)據(jù)應用過程中面臨較大的網(wǎng)絡安全壓力,必須高度重視防范數(shù)據(jù)被劫持的風險。為此,應從多個方面采取管控措施,包括限制數(shù)據(jù)訪問的時間、次數(shù)和訪問點等。同時,還應加強對外部攻擊的防范,形成社會化網(wǎng)絡安全體系以應對日益嚴峻的網(wǎng)絡安全威脅。
在數(shù)據(jù)保護方面,應加強對敏感數(shù)據(jù)的去標識化和匿名化處理工作,并探索運用區(qū)塊鏈等技術手段解決數(shù)據(jù)的歸屬性與資產(chǎn)性確認問題。此外,還應推動數(shù)據(jù)交易體系的完善和發(fā)展,提高場內(nèi)交易比例并降低場外交易風險,為數(shù)據(jù)要素的全面應用提供有力支持。
最后,IPv6是新型數(shù)據(jù)基礎設施的關鍵技術。域名、網(wǎng)址、IP地址這些都是傳統(tǒng)數(shù)字基礎設施尋址的依據(jù),新型的數(shù)據(jù)基礎設施需要設置標識提供可尋址的能力,IPv6已經(jīng)可以用在標識用戶群的身份、數(shù)據(jù)流的屬性、數(shù)據(jù)流的服務質量,但是仍然需要重視對智能體小程序的標識和對元數(shù)據(jù)標識的需求,要創(chuàng)新網(wǎng)絡數(shù)據(jù)資源的管理和開發(fā)模式,支持社會和產(chǎn)業(yè)的數(shù)字化轉型。
