Stiže li nova promjena u medicini?

Može li AI dijagnosticirati bolje od liječnika? Rezultati nove studije iznenađuju

Ilustracija Foto: Getty Images
Sustavi umjetne inteligencije u testovima hitne medicine pokazuju visoku razinu točnosti u odnosu na liječnike, pokazalo je najnovije istraživanje, no oni i dalje ne mogu zamijeniti kliničare u praksi.

Umjetna inteligencija u hitnoj službi sve češće konkurira liječnicima u dijagnostici. Nova studija objavljena u časopisu Science ispituje mogu li veliki jezični modeli dostići ili nadmašiti dijagnostičku učinkovitost liječnika u kliničkim uvjetima, uključujući stvarne slučajeve na odjelu hitne medicinske službe u Medicinskom centru Beth Israel Deaconess.

Istraživanje su proveli znanstvenici s Medicinskog fakulteta Harvard u SAD-u i američkog Medicinskog centra Beth Israel Deaconess, a uspoređivali su modele OpenAI-a o1 i 4o s dežurnim liječnicima specijalistima interne medicine u više eksperimenata koristeći stvarne medicinske kartone pacijenata.

U jednom ispitivanju koje je obuhvatilo 76 pacijenata na hitnom odjelu dijagnoze koje su postavila dva liječnika uspoređene su s rezultatima koje je generirala umjetna inteligencija, a nakon toga dijagnoze su neovisno ocjenjivali dodatni specijalisti interne medicine koji nisu znali koje je dijagnoze dao čovjek, a koje umjetna inteligencija.

"Na svakoj dijagnostičkoj točki o1 je ili nominalno bolji ili na razini dvaju liječnika specijalista i modela 4o", navodi se u studiji te dodaje da su razlike "bile posebno izražene na prvoj dijagnostičkoj točki (početna trijaža na hitnom prijemu), gdje je dostupno najmanje informacija o pacijentu i postoji najveća hitnost donošenja ispravne odluke."

"Testirali smo AI model protiv gotovo svih mjerila i nadmašio je i prethodne modele i naše liječničke referentne rezultate", izjavio je Arjun Manrai, voditelj laboratorija za umjetnu inteligenciju na Medicinskom fakultetu Harvard i jedan od glavnih autora studije, u priopćenju za medije navedenog fakulteta.

Uz identične ulazne podatke iz elektroničkih medicinskih kartona, model o1 postigao je točnu ili gotovo točnu dijagnozu u 67 % slučajeva trijaže, u usporedbi s 55 % i 50 % kod dvaju liječnika.

Kritika miješanja krušaka i jabuka

Kristen Panthagani, liječnica hitne medicine koja nije sudjelovala u studiji, u objavi o studiji na neovisnim internetskim stranicama navodi da se radi o "zanimljivoj studiji o umjetnoj inteligenciji koja je dovela do vrlo prenapuhanih naslova", posebno ističući da se AI dijagnoze uspoređuju s internistima, a ne s liječnicima hitne medicine, prenosi portal TechCrunch.

"Ako ćemo uspoređivati ​​alate umjetne inteligencije s kliničkim sposobnostima liječnika, trebali bismo početi usporedbom s liječnicima koji zapravo prakticiraju tu specijalnost", naglasila je.

A tko je odgovoran?

Adam Rodman, liječnik iz Medicinskog centra Beth Israel Deaconess i jedan od glavnih autora navedene studije, upozorio je u razgovoru za The Guardian da u ovom trenutku ne postoji formalan okvir za odgovornost, za dijagnostičke odluke koje uključuju umjetnu inteligenciju, odnosno da nije jasno tko snosi pravnu i profesionalnu odgovornost kada AI sudjeluje u dijagnostici. Rodman dodaje i da pacijenti i dalje žele da ih ljudi vode kroz odluke o životu ili smrti i da ih vode kroz složene odluke o liječenju.

Autori istraživanja naglasili su da nisu provodili nikakvu prethodnu obradu kliničkih podataka te su pozvali na dodatna ispitivanja u stvarnim uvjetima prije bilo kakve primjene dijagnostičke umjetne inteligencije u sustavu skrbi za pacijente.