準(zhǔn)確率97%的開(kāi)源肺炎檢測(cè)模型：照搬PyTorch教程、50張圖片就完了!

發(fā)布日期：2022-03-11 作者：WLT 點(diǎn)擊：

最近，一名澳大利亞人工智能博士候選人在LinkedIn上發(fā)表了一篇關(guān)于新型冠狀病毒病毒的研究文章。由于其話題性和聲稱(chēng)的97.5%的準(zhǔn)確率，這篇文章迅速獲得了數(shù)萬(wàn)條評(píng)論、點(diǎn)贊和轉(zhuǎn)發(fā)。但是，這樣的模型被拉出來(lái)，只用了50張圖片進(jìn)行訓(xùn)練。

一周內(nèi)建立一個(gè)準(zhǔn)確率97%的模型。事實(shí)是什么？

此前，澳大利亞一名人工智能博士候選人宣布構(gòu)建了一套深度學(xué)習(xí)模型，可以從肺部x光片中以97.5%的準(zhǔn)確率檢測(cè)出患者是否感染了新冠肺炎病毒。因?yàn)閲?guó)外疫情蔓延，醫(yī)療設(shè)施不足，所以人們對(duì)這個(gè)成績(jī)非常關(guān)注。短時(shí)間內(nèi)，他們收到了數(shù)萬(wàn)條評(píng)論、贊和轉(zhuǎn)發(fā)。他們還創(chuàng)建了Slack工作組，獲得了很多好評(píng)。

從目前發(fā)布的消息來(lái)看，整個(gè)項(xiàng)目有以下特點(diǎn):一套訓(xùn)練好的Python模型容器化應(yīng)用代碼和一套GitHub庫(kù)，已經(jīng)翻譯成多種語(yǔ)言的正在開(kāi)發(fā)的Web應(yīng)用和正在開(kāi)發(fā)的移動(dòng)應(yīng)用規(guī)劃藍(lán)圖，在AWS中托管這種無(wú)服務(wù)器架構(gòu)的模型在營(yíng)銷(xiāo)和贊助方面有大量的后續(xù)計(jì)劃。

而以上都是在一周內(nèi)快速完成的。隨后，Reddit用戶(hù)挑出了這個(gè)解決方案中的幾個(gè)嚴(yán)重問(wèn)題，進(jìn)行了整理和反駁。

只用50張圖片訓(xùn)練？

首先，這些網(wǎng)絡(luò)的潛在神經(jīng)表示非常復(fù)雜，需要使用大量的訓(xùn)練樣本來(lái)完成模型訓(xùn)練。但是截止到提交，這個(gè)新冠肺炎測(cè)試工具只看到了50個(gè)肺部圖像。

對(duì)于這樣一個(gè)超過(guò)150層，超過(guò)2000萬(wàn)個(gè)參數(shù)的網(wǎng)絡(luò)來(lái)說(shuō)，如此有限的訓(xùn)練樣本集顯然是可笑的。

該模型通過(guò)肺部X射線圖像來(lái)學(xué)習(xí)。

樣品有問(wèn)題。

此外，樣本中可能存在巨大的數(shù)據(jù)偏差。這50張圖片并不包含相關(guān)人員是否感染病毒，只是根據(jù)新冠肺炎急性病例導(dǎo)致的肺部手術(shù)進(jìn)行標(biāo)注。除非肺部已經(jīng)被病毒破壞，否則模型根本檢測(cè)不出任何感染跡象。另外，即使肺炎的癥狀已經(jīng)出現(xiàn)，如果不是急性癥狀，也無(wú)法證明這個(gè)模型的準(zhǔn)確性。重復(fù)圖像、代碼混亂和模型問(wèn)題。

最后，這個(gè)COVID模型基于流行的基準(zhǔn)網(wǎng)絡(luò)ResNet-50。雖然后者確實(shí)是圖像識(shí)別和分類(lèi)領(lǐng)域的常用方案，但ResNet的前期訓(xùn)練一般只覆蓋日常環(huán)境中的物體。換句話說(shuō)，ResNet網(wǎng)絡(luò)中的隱層更擅長(zhǎng)識(shí)別幾何形狀和彩色圖像，而我們?cè)趚光圖像中顯然找不到這樣的模式。正因?yàn)槿绱?，大多?shù)醫(yī)學(xué)神經(jīng)網(wǎng)絡(luò)只能選擇從零開(kāi)始構(gòu)建。

對(duì)這個(gè)代碼庫(kù)的進(jìn)一步觀察揭示了許多其他問(wèn)題。訓(xùn)練、驗(yàn)證和測(cè)試數(shù)據(jù)集中存在重復(fù)圖像，訓(xùn)練流程大多直接抄襲PyTorch教程，夾雜大量不必要的代碼；Hubissues也完全不可理解...

GitHub地址:https://github.com/elcronos/COVID-19項(xiàng)目負(fù)責(zé)人回應(yīng):我說(shuō)項(xiàng)目不可用。

最初，當(dāng)個(gè)別開(kāi)發(fā)人員與項(xiàng)目負(fù)責(zé)人溝通并提出問(wèn)題時(shí)，對(duì)方回應(yīng)說(shuō):

你好，xxx，我們的成果得到了加拿大xxx研究所放射科醫(yī)生的支持和認(rèn)可。

然而隨著越來(lái)越多的質(zhì)疑，項(xiàng)目負(fù)責(zé)人在GitHub中更新了介紹，說(shuō):

雖然這個(gè)項(xiàng)目的結(jié)果“看起來(lái)很有希望”，但我明確指出，這個(gè)模型還遠(yuǎn)遠(yuǎn)沒(méi)有，所以不應(yīng)該用于診斷或任何醫(yī)療決策。這是一項(xiàng)正在進(jìn)行的工作，我們需要有相關(guān)技能的人的幫助。我也在GitHub的資源庫(kù)中指出，我正在尋找能夠改進(jìn)和收集更好數(shù)據(jù)集的開(kāi)發(fā)者的幫助。

…

不幸的是，這個(gè)項(xiàng)目引起了相關(guān)專(zhuān)家的注意。他們沒(méi)有注意到模型還沒(méi)有準(zhǔn)備好，需要更好的數(shù)據(jù)集并幫助創(chuàng)建更好的模型，也沒(méi)有閱讀我們所有的免責(zé)聲明。我指責(zé)這個(gè)項(xiàng)目有誤導(dǎo)性，甚至有人暗示我有商業(yè)意圖。這對(duì)我的個(gè)人生活造成了一些負(fù)面影響，所以我決定退一步，暫時(shí)退出社交媒體。至少接下來(lái)的幾天，我不會(huì)在這個(gè)群里活動(dòng)。

完整版聲明參考:https://github.com/elcronos/COVID-19

然而，負(fù)責(zé)人仍在大力宣傳該項(xiàng)目，并開(kāi)始籌集資金。項(xiàng)目負(fù)責(zé)人創(chuàng)建了一個(gè)Slack討論組，該討論組有幾個(gè)子渠道，包括一個(gè)專(zhuān)門(mén)用于溝通和籌款的#營(yíng)銷(xiāo)渠道。此外，#保薦人頻道負(fù)責(zé)與潛在投資人溝通，報(bào)告其未來(lái)投資回報(bào)前景。

松弛討論組:https://app.slack.com/client/T010AJ5H31N/learning-slack

除此之外，名為#datascientists的頻道也沒(méi)有多少有用的內(nèi)容，里面全是熱情但缺乏經(jīng)驗(yàn)的新手。同樣，#醫(yī)生頻道的情況也差不多。唯一有價(jià)值的內(nèi)容是來(lái)自專(zhuān)業(yè)醫(yī)療人員的反對(duì)意見(jiàn)，比如不建議使用肺部x光診斷新冠肺炎感染。最后一個(gè)子通道#研究人員幾乎是空的。

另一方面，UI/UX頻道制作的內(nèi)容相當(dāng)豐富。目前，這個(gè)程序有五個(gè)不同的徽標(biāo)，外加一組專(zhuān)用于移動(dòng)和Web應(yīng)用程序的界面。

所以，對(duì)于這種說(shuō)法，大部分開(kāi)發(fā)商并不買(mǎi)賬。很多人認(rèn)為，在目前的特殊情況下，這種問(wèn)題嚴(yán)重的項(xiàng)目不應(yīng)該進(jìn)行發(fā)布和宣傳(甚至有開(kāi)發(fā)商調(diào)侃稱(chēng)，宣傳的工作量是開(kāi)發(fā)工作的20倍左右)。診斷中的醫(yī)學(xué)深度學(xué)習(xí)

深度卷積網(wǎng)絡(luò)在疾病的診斷和治療方面確實(shí)具有一系列潛在的優(yōu)勢(shì)。近年來(lái)，許多科學(xué)出版物都對(duì)這一新的發(fā)展方向給予了高度關(guān)注:2016年，來(lái)自倫敦的一組研究人員發(fā)表了一種新方法，基于包含8萬(wàn)張眼底照片的數(shù)據(jù)集，可以以86%的準(zhǔn)確率診斷糖尿病引起的視網(wǎng)膜病變。同年，來(lái)自烏干達(dá)的研究人員通過(guò)使用10，000個(gè)對(duì)象的數(shù)據(jù)集，評(píng)估了卷積神經(jīng)網(wǎng)絡(luò)(CNN)對(duì)微觀血液涂片的分析能力。兩名日本研究人員通過(guò)包含55萬(wàn)張CT掃描圖像的數(shù)據(jù)集，對(duì)肺結(jié)節(jié)進(jìn)行了大規(guī)模分類(lèi)操作。

然而，前面提到的新冠肺炎測(cè)試完全不同。稍微瀏覽一下其公布的代碼庫(kù)，就能看出作者對(duì)深度學(xué)習(xí)和AI技術(shù)的認(rèn)知嚴(yán)重不足。更糟糕的是，很多開(kāi)發(fā)者都在質(zhì)疑，他們顯然是想利用這次爆發(fā)來(lái)推廣自己。說(shuō)好的代碼改變世界？

深度學(xué)習(xí)絕不是最好的解決方案。近年來(lái)，無(wú)數(shù)毫無(wú)準(zhǔn)備的企業(yè)匆忙組建數(shù)據(jù)團(tuán)隊(duì)，卻發(fā)現(xiàn)成本在快速上升，卻沒(méi)有任何有意義的產(chǎn)出。

此前，李菲菲在一次采訪中提到:

泡沫確實(shí)存在。過(guò)度的夸張和炒作可以說(shuō)是鋪天蓋地。作為科學(xué)家，我希望這些泡沫盡快消散。只有注重實(shí)芯的人，才能推動(dòng)AI進(jìn)步，帶來(lái)實(shí)實(shí)在在的收益，這一點(diǎn)在醫(yī)療醫(yī)療、醫(yī)藥等領(lǐng)域尤為重要。

此外，我們永遠(yuǎn)不應(yīng)該利用技術(shù)來(lái)制造不公正、偏見(jiàn)或擴(kuò)大現(xiàn)有的不平等。對(duì)于AI技術(shù)，希望降低其接觸門(mén)檻，增加公平性，盡可能緩解各種相關(guān)矛盾。只要處理得當(dāng)，我們完全有機(jī)會(huì)利用人工智能技術(shù)創(chuàng)造更美好的未來(lái)。當(dāng)然，前提是我們要仔細(xì)梳理現(xiàn)有的AI成果，找出哪些是捏造的，哪些是真實(shí)的。

閱讀:李菲菲最新訪談:希望AI領(lǐng)域的泡沫盡快消散，尤其是醫(yī)療部分。

時(shí)至今日，AI技術(shù)仍在開(kāi)拓前進(jìn)。忽略了這一點(diǎn)，很容易陷入炒作的泥潭。

說(shuō)了這么多，任何一個(gè)理性的開(kāi)發(fā)商都不會(huì)貿(mào)然進(jìn)入，把自己的命運(yùn)交給運(yùn)氣。相反，只有先建立一支在AI/ML、DataOps、架構(gòu)、開(kāi)發(fā)等領(lǐng)域有專(zhuān)長(zhǎng)的團(tuán)隊(duì)，才能打贏這場(chǎng)仗。

最后，代碼不能讓世界變得更好也沒(méi)關(guān)系，不要惹麻煩就好。

關(guān)注我，轉(zhuǎn)發(fā)這篇文章。如果你相信我“收到信息”，你可以免費(fèi)獲得價(jià)值4999元的InfoQ迷你本！了解更多信息

本文網(wǎng)址：http://55swg.cn/news/953.html

相關(guān)標(biāo)簽：醫(yī)學(xué)神經(jīng),醫(yī)學(xué)深度

上一篇：5分鐘講清楚ABtset，詳解數(shù)據(jù)分析必備模型——辛普森悖論!
下一篇：肝硬化患者高危食管靜脈曲張列線圖預(yù)測(cè)模型的構(gòu)建研究!

新聞分類(lèi)