IBM為神經網絡模型添加水印,防止珍貴研究成果被盜

高層速讀

關鍵信息:任何有價值的東西都有被偷的可能性,IBM正在申請的專利可以給深度神經網絡模型打水印,來保證花費大量人力物力研發(fā)的成果不被盜,IBM共研發(fā)了3種算法,在特定的測試集中完全有效,IBM計劃在公司產品上使用,并逐漸推薦給用戶。

關鍵意義:“第一次有了一種強有力的方法來證明有人偷了模型,深度神經網絡很難建造,任何有價值的東西都會有被偷的可能,包括神經網絡?!?/p>

假貨是一個令所有企業(yè)都頭疼的問題,

拼多多最近也因為這事被美國一企業(yè)起訴,

雖然事情真假還未見分曉,

但假貨問題卻在每個行業(yè)中都存在,

包括人工智能領域。

想一想,

如果團隊研究了幾個月甚至是數年的算法模型被拿走了怎么辦?

現在守護好代碼已經不足夠了,

最好的方法是:給自家的模型打上水印,

即使別人拿走了也用不了。

IBM最近就在做這樣的事情。像是給自己制作的視頻、圖片打水印一樣,IBM新申請的專利可以給AI模型打水印。

IBM為神經網絡模型添加水印,防止珍貴研究成果被盜

他們的概念最近在韓國舉行的ACM亞洲計算機與通信安全會議(ASIACCS)上發(fā)布了,可能首先在IBM內部部署,然后將來逐步推向客戶。

IBM的認知網絡安全智能經理斯托克林說:“我們第一次有了一種強有力的方法來證明有人偷了模型。深度神經網絡模型需要強大的計算機、神經網絡專業(yè)知識和訓練數據,然后才能擁有一個高度精確的模型。它們很難建造,所以它們很容易被偷。任何有價值的東西都會有被偷的可能,包括神經網絡?!?/p>

研究人員開發(fā)了三種算法來生成三種相應類型的水?。阂环N將“有意義的內容”與算法的原始訓練數據結合在一起,作為水印嵌入到受保護的DNN中;將不相關的數據樣本作為水印嵌入到受保護的DNN中,以及將噪聲作為水印嵌入受保護的DNN中。

IBM為神經網絡模型添加水印,防止珍貴研究成果被盜

該團隊測試了三種嵌入算法,其中包括使用MNIST數據集、一個包含6萬個訓練圖像和1萬個測試圖像的手寫數字識別數據集,以及包含5萬個訓練圖像和1萬個測試圖像的對象分類數據集CIFAR10。

結果是,斯托克林說,所有這些都是“100%有效的”。

IBM為神經網絡模型添加水印,防止珍貴研究成果被盜

但是這在線下模式上行不通,盡管斯特克林指出,在這些情況下,抄襲的動機更少,因為這些模型不能被貨幣化,水印框架也無法保護DNN模型不被預測API竊取,攻擊者可以利用結果中的查詢訪問和機密性之間的張力來學習機器學習模型的參數。

但該團隊仍在繼續(xù)改進該方法,它將走向生產,最終商業(yè)化。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-07-23
IBM為神經網絡模型添加水印,防止珍貴研究成果被盜
關鍵意義:“第一次有了一種強有力的方法來證明有人偷了模型,深度神經網絡很難建造,任何有價值的東西都會有被偷的可能。

長按掃碼 閱讀全文