Gervigreind er ekkert betri í að greina covid-19 en einföld einkenniskönnun

Gervigreind sem greinir hljóð hósta til að greina covid-19 hafði verið tilkynnt að vera 99 prósent nákvæm, en ítarleg greining sýnir að hún er aðeins um 60 prósent nákvæm

Sick woman buying in supermarket and coughing into elbow during COVID-19 pandemic.

Gervigreind sem hlustar á mann hósta er ekki mjög góð í að spá fyrir um hvort hún sé með covid-19

Drazen Zigic/Shutterstock

Gervigreind er ekkert betri í að spá fyrir um hvort einhver sé með covid-19 en einfaldur spurningalisti þar sem fólk er beðið um sjálfsgreind einkenni.

Margar fyrri rannsóknir höfðu bent til þess að gervigreind kerfi gætu greint ákveðin hljóð í hósta og röddum fólks sem benda til covid-19 sýkingar, með nákvæmni sem tilkynnt er um allt að 99 prósent. En með því að prófa gervigreind á yfirgripsmiklu covid-19 gagnasafni frá bresku heilbrigðisþjónustunni, hafa vísindamenn sýnt fram á hversu áhrifamikill gervigreind árangur byggist að mestu á því að greina lýðfræðilega þætti sem tengjast líkum á covid-19 sýkingu.

„Við sýnum að kjötið af gervigreindarflokkunarframmistöðunni var vegna ruglingslegra þátta,“ segir Harry Coppock við Imperial College í London.

„Við söfnuðum stærsta gagnasettinu hingað til um fólk með og án covid-19 sem gaf fjögur [hljóð],“ segir hann. Rannsóknin prófaði þrjú gervigreind kerfi – þar á meðal eitt af nýjustu hljóðflokkandi gervigreindum – á hljóðupptökum frá meira en 67.000 PCR-prófuðum sjálfboðaliðum frá Bretlandi, þar á meðal 23.514 manns sem prófuðu jákvætt fyrir covid-19.

Þessar hljóðupptökur innihéldu fjórar mismunandi gerðir af hljóðum, segir Coppock: „Einn hósti, þrír hósti, setning þar sem segir „Ég elska ekkert meira en síðdegisrjóma“ – mjög breskt af okkur – og sú fjórða var útöndun.

Gervigreind hefur lítið gagnast við greiningu á covid-19

Nafnlaus heilsufarsgögn úr gögnum sjálfboðaliðanna í heilbrigðisþjónustu sjálfboðaliðanna gerðu rannsakendum kleift að athuga hvort gervigreindir séu einfaldlega að spá fyrir um covid-19 sýkingu á grundvelli 16 ruglingsþátta – eins og kyns, þjóðernis og staðsetningar. Með því að passa saman snið fólks sem hafði prófað jákvætt við svipað snið fólks sem hafði prófað neikvætt, stefndu rannsakendur að því að fjarlægja hvers kyns AI forspárkraft byggt á sameiginlegum lýðfræðilegum þáttum.

Gervigreindin sá „mikið fall í frammistöðu“ úr 90 prósentum í 60 prósent þegar tekið var tillit til ruglingsþáttanna, segir Coppock. Byggt á viðbótartilraunum grunar rannsakendur að hin 10 prósent af gervigreindarafköstum umfram nákvæmni við að fletta myntinni séu einnig vegna ógreindrar hlutdrægni.

Niðurstaðan er sú að gervigreindin var betri með einföldum spurningalista um einkennisskoðun sem væri bæði ódýrara og auðveldara í notkun, segir Coppock.

„Þessi vinna er mikilvæg vegna þess að ef við skiljum ekki hvernig hljóðbundin gervigreind skimun á covid-19 gæti virkað við raunverulegar aðstæður, þá munum við ofmeta gildi eingöngu tæknilegrar lausnar við uppsetningu,“ segir Marzyeh Ghassemi á Massachusetts Institute of Technology.

Tilvísun: arxiv.org/abs/2212.08570

Related Posts