為了數據也是拼了!多倫多大學用人造X射線訓練人工智能

高層速讀

關鍵信息:為了解決罕見疾病X射線數據較少的問題,多倫多大學工程師們設計了一種新的方法,利用機器學習創(chuàng)造出人造X射線來增強人工智能訓練集,他們使用深度卷積生成對抗網絡(DCGAN)來生成并持續(xù)改進模擬圖像。

關鍵數據:在一般情況下,結合了人造X射線的增強數據集的分類精度提高了20%,在一些罕見疾病中,準確率提高到40%左右。

關鍵意義:從某種意義上說,我們正在利用機器學習來進行機器學習。

為了數據也是拼了!多倫多大學用人造X射線訓練人工智能

在象限的左邊是病人胸部的真實X射線圖像,旁邊是由人造的合成X射線

人工智能可以提高醫(yī)學診斷速度和準確性,但在臨床醫(yī)生利用人工智能來識別X射線等圖像的情況之前,他們必須“教”會算法尋找什么。

在醫(yī)學圖像中識別罕見的病理現象,給研究人員帶來了持續(xù)的挑戰(zhàn),因為在監(jiān)督學習環(huán)境中,可以用來訓練人工智能系統(tǒng)的圖像十分缺乏。

為了數據也是拼了!多倫多大學用人造X射線訓練人工智能

多倫多大學電子與計算機工程系(ECE)Shahrokh Valaee教授和他的團隊設計了一種新的方法:利用機器學習創(chuàng)造計算機生成的X射線來增強人工智能訓練集?!皬哪撤N意義上說,我們正在利用機器學習來進行機器學習”,Valaee說。

“我們正在通過計算機制造某些罕見疾病的X射線,我們可以將它們與真實的X射線結合起來,從而擁有足夠大的數據庫來訓練神經網絡,以便此后從其他X射線中識別出有異常情況的數據。”

為了數據也是拼了!多倫多大學用人造X射線訓練人工智能

Valaee是醫(yī)學實驗室(MIMLab)機器智能的一員,這是一個內科醫(yī)生、科學家和工程研究人員組成的團隊,他們將自己在圖像處理、人工智能和醫(yī)學方面的專業(yè)知識結合起來,以解決醫(yī)療挑戰(zhàn)。

“人工智能有潛力在醫(yī)學領域提供各種各樣的幫助”Valaee說,“但要做到這一點,我們需要大量的數據——我們需要數千個標簽的圖像讓這些系統(tǒng)發(fā)揮作用,但一些罕見疾病的數據太少了?!?/p>為了數據也是拼了!多倫多大學用人造X射線訓練人工智能

為了制造這些人造X射線,研究小組使用一種被稱為深度卷積生成對抗網絡(DCGAN)的技術來生成并持續(xù)改進模擬圖像。

GANs是由兩個網絡組成的一種算法:一個是生成網絡,一個是判別器網絡,生成網絡負責生成圖像,判別器則負責從真實圖像中區(qū)分出合成的圖像,直到這兩個網絡被訓練成一個點,判鑒別器不能區(qū)分真實的圖像和合成的圖像,就可以輸出了。

一旦有足夠數量的人造X射線被創(chuàng)造出來,它們就會與真實的X射線相結合,來訓練一個深度卷積神經網絡,這個網絡負責將需要鑒別的圖像分類為正?;蚱渌闆r。

為了數據也是拼了!多倫多大學用人造X射線訓練人工智能

Valaee說:“我們已經能夠證明,由深度卷積的GANs生成的人工數據可以用來增強真實的數據集,這為培訓提供了更多的數據,并提高了這些系統(tǒng)在識別罕見疾病方面的性能?!?/p>

在通過人工智能系統(tǒng)輸入數據時,MIMLab將其增強數據集的準確性與原始數據集進行了比較,發(fā)現在一般情況下,增強數據集的分類精度提高了20%,在一些罕見的情況下,準確率提高到40%左右。

由于合成的X光并不是來自真實的個體,所以數據集容易獲得,同時也不會存在侵犯隱私方面的擔憂。Valaee說:“這很令人興奮,我們已經能夠克服將人工智能應用于醫(yī)學的障礙?!?/p>

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-07-10
為了數據也是拼了!多倫多大學用人造X射線訓練人工智能
利用機器學習創(chuàng)造出人造X射線來增強人工智能訓練集,他們使用深度卷積生成對抗網絡來生成并持續(xù)改進模擬圖像。

長按掃碼 閱讀全文