Læknisfræðileg gervigreind Google getur svarað algengum læknisfræðilegum spurningum sem settar eru inn í leitarvélar. Africa Studio/Shutterstock
Google hefur smíðað það besta gervigreind enn til að svara læknisfræðilegum spurningum. Med-PaLM AI getur svarað fjölvalsspurningum úr læknisfræðilegum leyfisprófum og algengum heilsufarsspurningum á leitarvélum með meiri nákvæmni en nokkur fyrri gervigreind og næstum jafn vel og læknar.
Alan Karthikesalingam og samstarfsmenn hans hjá Google byrjuðu fyrst að vinna með an AI sem fyrirtækið þróaði sem heitir PaLM, sem var þjálfað í margs konar textategundum, þar á meðal netskjölum, bókum og Wikipedia, til að framkvæma verkefni sem krefjast þess að skilja tungumál. PaLM er meðal þeirra stærstu gervigreinda tungumála sem búið er til hingað til og notar 540 milljarða færibreytur – gildin sem gervigreindin hefur stillt innbyrðis til að mynda svör við spurningum eða verkefnum.
Rannsakendur fínstilltu síðan gervigreindina með því að gefa henni leiðbeiningar um hvernig eigi að svara læknisfræðilegum spurningum.
Þegar skorað var á að svara fjölvalsspurningum úr prófum í læknisfræðileyfi, stóð þessi uppfærða gervigreind fram með 67,6 prósenta nákvæmni – 17 prósenta framför á næstbesta gervigreindinni.
Að lokum bættu vísindamennirnir við sérstökum leiðbeiningum sem hjálpa gervigreindinni að fylgja betur leiðbeiningum um að svara læknisfræðilegum spurningum og búa til Med-PaLM.
Gervigreindin passaði næstum því við frammistöðu mannlegs læknis þegar hann svaraði opnum læknisfræðilegum spurningum – eins og „hvernig geturðu skotið ígerð“ – úr Google leitarfyrirspurnum sem rannsakendur söfnuðu. Svör gervigreindar pössuðu við mest viðurkennda svarið byggt á núverandi læknisfræðilegri þekkingu 92,6 prósent tilvika, en svör læknanna áttu saman við 92,9 prósent af tímanum.
„Ný tækni ætti að vera að minnsta kosti jafn góð og mannlegur læknir, ef ekki betri,“ segir Sara Gerke , siðfræðifræðingur í gervigreind við Penn State Dickinson Law í Pennsylvaníu. „Mörg lönd í heiminum, sérstaklega þróunarlönd, þurfa á fleiri læknum að halda og slík tæki hafa mikla möguleika til að fylla upp í að minnsta kosti hluta af skortinum.
En Gerke varaði líka við því að mannleg tilhneiging til að treysta sannfærandi – en stundum algerlega röng – gervigreindarsvör geta haft alvarlegar afleiðingar þegar heilsa einstaklings er í húfi. Sérhver læknisfræðileg gervigreind ætti að vera endurskoðuð af eftirlitsstofnunum stjórnvalda áður en þau koma á markaðinn, segir hún, og helst væri stöðugt fylgst með þeim, jafnvel eftir markaðssetningu.
Karthikesalingam segir að slík gervigreind séu ekki enn örugg og tilbúin til notkunar í heilbrigðisþjónustu. Eitt skref í átt að því að gera gervigreindina öruggari felur í sér að biðja menn um að meta líkurnar á því að rangt svar við gervigreind geti leitt til líkamlegs eða andlegs skaða. Aðeins 5,8 prósent af Med-PaLM AI svörunum voru metin sem hugsanlega að leiða til skaða, sem er á pari við 6,8 prósent af svörum læknisfræðinga sem eru metin hugsanlega skaðleg. En Karthikesalingam segir að þörf sé á meiri vinnu við að meta hugsanlegan skaða sem tengist sérstökum læknisfræðilegum atburðarásum og viðbrögðum. Til að bæta gervigreindina vilja vísindamennirnir þróa leið til þess að koma skýrt á framfæri hvers kyns óvissu í svörunum sem það gefur, segir Vivek Natarajan hjá Google. Slík gervigreind ættu líka skýrt að tilgreina og vitna í upplýsingaveitur svo fólk geti séð hvaðan svörin koma, segir hann.
Tilvísun: arxiv.org/abs/2212.13138