源頭治理提升數(shù)據(jù)“免疫力”
2025-08-06 11:13:12? ?來源:廣州日報 責任編輯:孫勁貞 我來說兩句 |
當前,人工智能已深度融入經(jīng)濟社會發(fā)展的方方面面,在深刻改變?nèi)祟惿a(chǎn)生活方式的同時,也成為關(guān)乎高質(zhì)量發(fā)展和高水平安全的關(guān)鍵領(lǐng)域。然而,人工智能的訓(xùn)練數(shù)據(jù)存在良莠不齊的問題,其中不乏虛假信息、虛構(gòu)內(nèi)容和偏見性觀點,造成數(shù)據(jù)源污染,給人工智能安全帶來新的挑戰(zhàn)。 人工智能的三大核心要素是算法、算力和數(shù)據(jù),其中數(shù)據(jù)是訓(xùn)練AI模型的基礎(chǔ)要素,也是AI應(yīng)用的核心資源。簡單地說,人工智能是通過數(shù)據(jù)構(gòu)建自己的“世界觀”和“價值觀”。數(shù)據(jù)質(zhì)量直接決定了人工智能系統(tǒng)的“認知基線”。當訓(xùn)練數(shù)據(jù)被虛假信息、偏見觀點和虛構(gòu)內(nèi)容系統(tǒng)性污染時,AI獲得的不是客觀世界的鏡像,而是一幅扭曲變形的認知地圖。那么,人類在與這樣的AI互動時,必然獲得的也是變形失真的信息。有研究顯示,當訓(xùn)練數(shù)據(jù)集中僅有0.01%的虛假文本時,模型輸出的有害內(nèi)容會增加11.2%;即使是0.001%的虛假文本,其有害輸出也會相應(yīng)上升7.2%。如此微量的數(shù)據(jù)污染就能引發(fā)輸出端的指數(shù)級危害增長,數(shù)據(jù)污染的破壞力讓人不寒而栗。考慮我們當下的AI應(yīng)用場景,從醫(yī)療診斷到司法判決,從金融風控到自動駕駛,AI應(yīng)用場景不斷擴展,意味著數(shù)據(jù)污染的風險影響范圍也在同步擴大,其現(xiàn)實風險令人警醒。 數(shù)據(jù)污染危機提醒我們,科技從來都是雙刃劍,任何對技術(shù)盲目樂觀的態(tài)度都是極度危險的。人工智能一路狂奔,業(yè)界熱衷于談?wù)撍惴ㄍ黄坪退懔Ω傎悾瑓s對訓(xùn)練數(shù)據(jù)的源頭治理缺乏足夠重視,將各類數(shù)據(jù)視為無差別“養(yǎng)料”,忽視其可靠性與安全性。 應(yīng)對人工智能數(shù)據(jù)污染需要構(gòu)建多層次的防御體系。源頭治理是關(guān)鍵,正如環(huán)境治理需要從源頭控制污染一樣,人工智能安全必須從數(shù)據(jù)入口筑起第一道防線。在技術(shù)層面,必須建立數(shù)據(jù)溯源驗證機制,大力發(fā)展虛假信息檢測和偏見識別等前沿技術(shù),讓數(shù)據(jù)擁有強大的“免疫系統(tǒng)”。加強法治監(jiān)管,歐盟《人工智能法案》明確高風險AI系統(tǒng)必須使用高質(zhì)量、有代表性且無歧視的數(shù)據(jù)集,這種立法思路值得借鑒。公眾則需提升數(shù)字素養(yǎng),形成守護數(shù)據(jù)安全的社會共識。如此,我們才能確保人工智能這把雙刃劍始終為人類福祉服務(wù)。 |
相關(guān)閱讀:
![]() |
![]() |
打印 | 收藏 | 發(fā)給好友 【字號 大 中 小】 |
信息網(wǎng)絡(luò)傳播視聽節(jié)目許可(互聯(lián)網(wǎng)視聽節(jié)目服務(wù)/移動互聯(lián)網(wǎng)視聽節(jié)目服務(wù))證號:1310572 廣播電視節(jié)目制作經(jīng)營許可證(閩)字第085號
網(wǎng)絡(luò)出版服務(wù)許可證 (署)網(wǎng)出證(閩)字第018號 增值電信業(yè)務(wù)經(jīng)營許可證 閩B2-20100029 互聯(lián)網(wǎng)藥品信息服務(wù)(閩)-經(jīng)營性-2015-0001
福建日報報業(yè)集團擁有東南網(wǎng)采編人員所創(chuàng)作作品之版權(quán),未經(jīng)報業(yè)集團書面授權(quán),不得轉(zhuǎn)載、摘編或以其他方式使用和傳播
職業(yè)道德監(jiān)督、違法和不良信息舉報電話:0591-87095403(工作日9:00-12:00、15:00-18:00) 舉報郵箱:jubao@fjsen.com 福建省新聞道德委舉報電話:0591-87275327