精品人妻少妇嫩草av,国产精品一品二区三区的使用体验,97精品一区二区视频在线观看,jlzzjizz日本丰满少妇

Technical Articles

技術(shù)文章

當(dāng)前位置:首頁  >  技術(shù)文章  >  康謀分享 | 突破傳統(tǒng)匿名化:先進(jìn)技術(shù)解鎖數(shù)據(jù)價(jià)值新維度

康謀分享 | 突破傳統(tǒng)匿名化:先進(jìn)技術(shù)解鎖數(shù)據(jù)價(jià)值新維度

更新時(shí)間:2025-02-18      點(diǎn)擊次數(shù):19

海量數(shù)據(jù)的收集使得新舊企業(yè)能夠利用機(jī)器學(xué)習(xí)技術(shù)開發(fā)新產(chǎn)品并革新舊產(chǎn)品。近年來,數(shù)據(jù)質(zhì)量因直接影響了人工智能系統(tǒng)的性能和魯棒性而備受關(guān)注。然而,這對通常通過破壞像素信息(如模糊化、馬賽克等)來實(shí)現(xiàn)匿名化的方法提出了挑戰(zhàn),這些方法導(dǎo)致合規(guī)性與數(shù)據(jù)質(zhì)量之間難以兼得。

我們探索了一種不是簡單移除像素信息,而是對其進(jìn)行自然替換的深度自然匿名化(Deep Natural Anonymization,DNAT)方法,致力于提高匿名化數(shù)據(jù)價(jià)值,助力企業(yè)開發(fā)創(chuàng)新。


一、匿名化數(shù)據(jù)的傳統(tǒng)矛盾

DNAT能夠檢測人臉、車牌等可識(shí)別信息,并為每個(gè)對象生成人工替換。每個(gè)替換都盡可能匹配源對象的屬性,但這種匹配是有選擇性的,我們可以靈活控制保留哪些屬性。

例如,對于人臉,保留性別和年齡等屬性可能對后續(xù)分析至關(guān)重要。對于可識(shí)別信息以外的內(nèi)容,不包含敏感個(gè)人數(shù)據(jù)的信息則保留不做修改。通過這種方式,DNAT成功打破了數(shù)據(jù)消除與匿名化之間的傳統(tǒng)矛盾。

康謀分享 | 突破傳統(tǒng)匿名化:先進(jìn)技術(shù)解鎖數(shù)據(jù)價(jià)值新維度

圖1: 匿名化工具的比較,從左至右依次為:Facepixelizer,YouTube,F(xiàn)ast Redaction,DNAT,原圖

為了衡量匿名化方法對數(shù)據(jù)質(zhì)量的影響,我們從Labeled Face in the Wild(LFW)數(shù)據(jù)集中采樣了圖像。所有圖像均取自測試集。我們比較了代表匿名化技術(shù)的四種不同的匿名化工具,圖1顯示了這些示例的一部分。


二、匿名化的結(jié)構(gòu)一致性

首先,我們分析了圖像在匿名化處理后的整體結(jié)構(gòu)變化。為此,我們仔細(xì)研究了圖像分割結(jié)果。圖像分割是將圖像的像素劃分為多個(gè)片段的過程,每個(gè)片段代表一個(gè)對象類別。在我們的示例中,最重要的對象是個(gè)人資料圖片中的人物和背景

圖2和圖3展示了LFW數(shù)據(jù)集中兩位名人的分割圖。這些分割圖是由語義分割模型DeepLabv3+生成的,采用了TensorFlow存儲(chǔ)庫中的實(shí)現(xiàn)和模型權(quán)重。

康謀分享 | 突破傳統(tǒng)匿名化:先進(jìn)技術(shù)解鎖數(shù)據(jù)價(jià)值新維度

圖2: AI Pacino DeepLabv3+ 分割結(jié)果對比

康謀分享 | 突破傳統(tǒng)匿名化:先進(jìn)技術(shù)解鎖數(shù)據(jù)價(jià)值新維度

圖3: Reese witherspoon DeepLabv3+ 分割結(jié)果對比

從圖2和圖3中可以看出,傳統(tǒng)匿名化方法的分割圖明顯退化,其中一些甚至很多錯(cuò)誤。然而,深度自然匿名化(DNAT)保留了語義分割。分割圖與原始圖像幾乎非常相同。從圖3中可以看出,經(jīng)過傳統(tǒng)匿名化方法處理的人臉圖像不僅產(chǎn)生了較差的分割邊界,還使分割模型推斷出原始圖像中從未出現(xiàn)的新對象類別,如貓、狗或瓶子。

為了量化每種匿名化技術(shù)的影響,我們計(jì)算了整個(gè)測試集的平均交并比(mIOU)。計(jì)算是在不同方法生成的圖像分割圖與原始圖像分割圖之間進(jìn)行的。結(jié)果如表1所示。

表1:用mIOU測量的語義分割一致性(越高越好)

康謀分享 | 突破傳統(tǒng)匿名化:先進(jìn)技術(shù)解鎖數(shù)據(jù)價(jià)值新維度


三、匿名化的內(nèi)容一致性

為了評估匿名化圖像與原始圖像之間的整體內(nèi)容一致性,我們使用了Clarifai的獨(dú)立圖像標(biāo)注模型?!巴ㄓ脠D像標(biāo)注模型能夠識(shí)別超過11,000種不同的概念,包括對象、主題、情緒等。"這些標(biāo)簽描述了模型從輸入圖像中推斷出的內(nèi)容。

此外,模型還為每個(gè)標(biāo)簽提供了置信度。圖4展示了Clarifai公共圖像標(biāo)注模型對原始圖像及其DNAT版本預(yù)測的前5個(gè)概念。

康謀分享 | 突破傳統(tǒng)匿名化:先進(jìn)技術(shù)解鎖數(shù)據(jù)價(jià)值新維度

圖4:來自clarifai的Reese Witherspoon前5個(gè)概念。(左原始圖像,右DNAT)

理想情況下,通用圖像標(biāo)注模型應(yīng)該為原始圖像和匿名化圖像預(yù)測一樣的概念。為了衡量一致性,我們使用Clarifai為每種匿名化技術(shù)的所有測試樣本預(yù)測概念。然后,我們計(jì)算了匿名化圖像與原始圖像之間前N個(gè)預(yù)測概念的平均精度(mAP)(其中N代表不同概念的數(shù)量)。

通過mAP,我們評估了兩點(diǎn):預(yù)測概念的一致性及其相關(guān)分?jǐn)?shù)。例如,考慮一個(gè)匿名化圖像及其原始圖像對,經(jīng)過圖像標(biāo)注模型處理后,如果某個(gè)概念在匿名化圖像中的置信度值低于其在原始圖像中的置信度值,則對最終mAP分?jǐn)?shù)的影響較小;而如果某個(gè)概念僅出現(xiàn)在匿名化圖像中,而未出現(xiàn)在其原始圖像中,則影響較大。

前5和前50個(gè)概念的結(jié)果如表2所示。

表2:用mAP測量圖像概念一致性(越高越好)

康謀分享 | 突破傳統(tǒng)匿名化:先進(jìn)技術(shù)解鎖數(shù)據(jù)價(jià)值新維度


四、總結(jié)

本文探討了如何通過深度自然匿名化(DNAT)技術(shù)提升匿名化數(shù)據(jù)的價(jià)值,打破了傳統(tǒng)匿名化方法在合規(guī)性與數(shù)據(jù)質(zhì)量之間的固有權(quán)衡。DNAT通過生成自然替換而非破壞像素信息,不僅有效保護(hù)了個(gè)人隱私,還最大限度地保留了數(shù)據(jù)的分析價(jià)值。

實(shí)驗(yàn)表明,DNAT在圖像分割內(nèi)容一致性方面顯著優(yōu)于傳統(tǒng)匿名化方法,能夠更好地支持后續(xù)的AI分析和應(yīng)用。



400-999-3848
歡迎您的咨詢
我們將竭盡全力為您用心服務(wù)
3634354716
關(guān)注微信
版權(quán)所有 © 2025 廣州虹科電子科技有限公司  備案號(hào):粵ICP備15080866號(hào)
91精品人妻一区二区三区蜜桃臀| 国产精品日韩av| 少妇熟女一区| 精品国产一区二区三区久久久久久| 亚洲影院在线观看| 中文字幕乱妇无码AV在线| 色综合久久天天综合网| 成年黄网站18禁免费观看在线| 精品视频一区二区在线观看| 老熟妇一区二区三区| 亚洲国产成人精品女人| 1024久久久亚洲精品aⅴ| 波多野吉衣在线观看| 久久久久久999| 樱桃视频一区二区三区| 中文字幕乱码一区二区三区| 久久久www成人免费毛片女| 中文字幕日本人妻久久免费| 日本丰满人妻hd浓毛| 欧美久久黄色| 精品人妻伦一区二区三区久久 | 精品国产乱码久久久久久app| 亚洲毛片av| 中国精品毛片aaa无遮挡| 尤物久久av一区二区三区亚洲| 国产毛片av| 久久精品欧美一区二区| 国产精品熟女一区二区不卡| 粉嫩一区二区三区| 天堂av免费在线观看| 91欧美激情一区二区三区成人| √天堂8资源中文在线| 亚洲激情久久| 久久99精品久久| 999国产精品999久久久久久 | 午夜av一区二区三区 | 91肥老熟妇伦子伦| 丁香婷婷综合久久久久观看| 中文字幕精品人妻一区二区三区| 成人免费在线电影| 久久96热人妻偷产精品|