Selasa, 14/05/2024 09:37 WIB

Chatbot Kesehatan Bertenaga AI Lulus Ujian Medis AS

Chatbot medis bertenaga kecerdasan buatan yang dikembangkan Google mencapai nilai kelulusan pada ujian lisensi medis Amerika Serikat (AS) yang sulit.

Log Google (Foto: Matt Rourke/AP)

JAKARTA, Jurnas.com - Chatbot medis bertenaga kecerdasan buatan yang dikembangkan Google mencapai nilai kelulusan pada ujian lisensi medis Amerika Serikat (AS) yang sulit, tetapi jawabannya masih kurang dari jawaban dari dokter manusia, kata sebuah studi peer-review pada Rabu (12/7).

Tahun lalu peluncuran ChatGPT, yang pengembangnya OpenAI didukung oleh saingan Google, Microsoft memulai perlombaan antara raksasa teknologi di bidang AI yang sedang berkembang.

Sementara banyak yang telah dibuat tentang kemungkinan dan bahaya AI di masa depan, kesehatan adalah salah satu area di mana teknologi telah menunjukkan kemajuan yang nyata, dengan algoritme yang mampu membaca pemindaian medis tertentu serta manusia.

Google pertama kali meluncurkan alat AI untuk menjawab pertanyaan medis, yang disebut Med-PaLM, dalam studi pracetak pada bulan Desember. Tidak seperti ChatGPT, itu belum dirilis ke publik.

Raksasa teknologi AS mengatakan Med-PaLM adalah model bahasa besar pertama, teknik AI yang dilatih pada sejumlah besar teks yang diproduksi manusia, yang lulus Ujian Perizinan Medis AS (USMLE).

Nilai kelulusan untuk ujian, yang diambil oleh mahasiswa kedokteran dan dokter dalam pelatihan di AS, adalah sekitar 60 persen. Pada bulan Februari, sebuah penelitian mengatakan bahwa ChatGPT telah mencapai hasil passing atau near-passing.

Sementara banyak yang telah dibuat tentang kemungkinan - dan bahaya - AI di masa depan, kesehatan adalah salah satu area di mana teknologi telah menunjukkan kemajuan yang nyata, dengan algoritme yang mampu membaca pemindaian medis tertentu serta manusia.

Google pertama kali meluncurkan alat AI untuk menjawab pertanyaan medis, yang disebut Med-PaLM, dalam studi pracetak pada bulan Desember. Tidak seperti ChatGPT, itu belum dirilis ke publik.

Raksasa teknologi AS mengatakan Med-PaLM adalah model bahasa besar pertama, teknik AI yang dilatih pada sejumlah besar teks yang diproduksi manusia, yang lulus Ujian Perizinan Medis AS (USMLE).

Nilai kelulusan untuk ujian, yang diambil oleh mahasiswa kedokteran dan dokter dalam pelatihan di AS, adalah sekitar 60 persen.

Pada bulan Februari, sebuah penelitian mengatakan bahwa ChatGPT telah mencapai hasil passing atau near-passing.

Dalam studi peer-review yang diterbitkan dalam jurnal Nature pada hari Rabu, peneliti Google mengatakan bahwa Med-PaLM telah mencapai 67,6 persen pada pertanyaan pilihan ganda gaya USMLE.

"Med-PaLM memberikan semangat, tetapi tetap kalah dengan dokter," kata studi tersebut.

Untuk mengidentifikasi dan mengurangi "halusinasi" - nama ketika model AI menawarkan informasi palsu - Google mengatakan telah mengembangkan tolok ukur evaluasi baru.

Karan Singhal, seorang peneliti Google dan penulis utama studi baru tersebut, mengatakan kepada AFP bahwa tim tersebut telah menggunakan tolok ukur untuk menguji versi terbaru dari model mereka dengan hasil yang "sangat menarik".

Med-PaLM 2 telah mencapai 86,5 persen pada ujian USMLE, melampaui versi sebelumnya hampir 20 persen, menurut studi pracetak yang dirilis pada bulan Mei yang belum ditinjau oleh rekan sejawat.

James Davenport, seorang ilmuwan komputer di University of Bath Inggris yang tidak terlibat dalam penelitian tersebut, mengatakan "ada seekor gajah di dalam ruangan" untuk chatbot medis bertenaga AI ini.

Ada perbedaan besar antara menjawab "pertanyaan medis dan pengobatan yang sebenarnya", yang mencakup diagnosis dan pengobatan masalah kesehatan yang sebenarnya, katanya.

Anthony Cohn, pakar AI di Universitas Leeds Inggris, mengatakan bahwa halusinasi kemungkinan akan selalu menjadi masalah untuk model bahasa sebesar itu, karena sifat statistiknya.

Oleh karena itu model-model ini "harus selalu dianggap sebagai asisten daripada pembuat keputusan akhir," kata Cohn.

Singhal mengatakan bahwa di masa mendatang Med-PaLM dapat digunakan untuk mendukung para dokter untuk menawarkan alternatif yang mungkin belum pernah dipertimbangkan sebelumnya.

The Wall Street Journal melaporkan awal pekan ini bahwa Med-PaLM 2 telah diuji di rumah sakit penelitian Klinik Mayo AS yang bergengsi sejak April.

Singhal mengatakan dia tidak dapat berbicara tentang kemitraan khusus. Tetapi dia menekankan bahwa pengujian apa pun tidak akan bersifat "klinis, atau menghadap pasien, atau dapat membahayakan pasien".

"Alih-alih, itu untuk lebih banyak tugas administratif yang dapat diotomatisasi dengan relatif mudah, dengan taruhan rendah," tambahnya.

Sumber: AFP

KEYWORD :

Chatbot AI Chatbot Medis Google Kecerdasan Buatan




JURNAS VIDEO :

PILIHAN REDAKSI :