Γράφει ο Δημήτριος Θεοδωρόπουλος*
Τον Ιανουάριο του 2026 η OpenAI παρουσίασε το ChatGPT Health, μια εξειδικευμένη έκδοση του γνωστού συστήματος τεχνητής νοημοσύνης που έχει σχεδιαστεί για να απαντά σε ερωτήματα υγείας και να καθοδηγεί τους χρήστες σχετικά με το πόσο επείγον είναι ένα σύμπτωμα. Με απλά λόγια, πρόκειται για ένα ψηφιακό εργαλείο που επιχειρεί να λειτουργήσει σαν «πρώτη γραμμή» ενημέρωσης: αν κάποιος έχει πυρετό, πόνο στο στήθος, δύσπνοια ή ανησυχεί για ένα ψυχολογικό σύμπτωμα, μπορεί να περιγράψει την κατάστασή του και να λάβει μια σύσταση για το αν χρειάζεται άμεση επίσκεψη στα επείγοντα, ραντεβού μέσα στις επόμενες 24–48 ώρες ή απλή παρακολούθηση στο σπίτι. Η ανταπόκριση του κοινού ήταν εντυπωσιακή, με εκατομμύρια χρήστες να στρέφονται στο εργαλείο για γρήγορη, εύκολη και δωρεάν καθοδήγηση.
Όμως όταν ένα σύστημα τεχνητής νοημοσύνης καλείται να «κρίνει» την επικινδυνότητα ενός συμπτώματος, οι συνέπειες μπορεί να είναι σοβαρές. Μια λανθασμένη εκτίμηση δεν είναι απλώς ένα τεχνικό σφάλμα· μπορεί να σημαίνει καθυστέρηση σε μια κρίσιμη διάγνωση ή, αντίθετα, άσκοπη επιβάρυνση των επειγόντων περιστατικών. Για να διερευνηθεί η αξιοπιστία του ChatGPT Health, μια ομάδα ερευνητών δημοσίευσε σχετική μελέτη στο επιστημονικό περιοδικό «Nature Medicine», επιχειρώντας να δοκιμάσει συστηματικά το σύστημα σε ελεγχόμενες συνθήκες.
Η μελέτη σχεδιάστηκε ως «τεστ αντοχής». Οι ερευνητές δημιούργησαν 60 κλινικά σενάρια, γραμμένα από γιατρούς, τα οποία κάλυπταν 21 διαφορετικούς τομείς της ιατρικής, από καρδιολογικά και αναπνευστικά περιστατικά μέχρι ενδοκρινολογικά και ψυχιατρικά. Κάθε σενάριο παρουσιάστηκε στο σύστημα υπό 16 διαφορετικές παραλλαγές, αλλάζοντας μικρές λεπτομέρειες, όπως το πώς διατυπώνεται το πρόβλημα ή αν κάποιο τρίτο πρόσωπο υποβαθμίζει τα συμπτώματα. Συνολικά παρήχθησαν 960 απαντήσεις, οι οποίες συγκρίθηκαν με τη «χρυσή» ιατρική σύσταση, δηλαδή την ενδεδειγμένη κλινική αντιμετώπιση.
Τα αποτελέσματα έδειξαν ένα ενδιαφέρον αλλά ανησυχητικό μοτίβο. Η απόδοση του συστήματος ακολουθούσε μια καμπύλη σε σχήμα ανεστραμμένου U: τα πήγαινε καλύτερα σε μεσαίας σοβαρότητας περιστατικά, αλλά εμφάνιζε τα πιο επικίνδυνα λάθη στα «άκρα», δηλαδή σε περιπτώσεις που ήταν ξεκάθαρα μη επείγουσες ή ξεκάθαρα επείγουσες. Συγκεκριμένα, στα μη επείγοντα περιστατικά καταγράφηκε σημαντικό ποσοστό ακατάλληλων συστάσεων, ενώ στις πραγματικές ιατρικές καταστάσεις έκτακτης ανάγκης τα προβλήματα ήταν ακόμη πιο έντονα.
Το πιο ανησυχητικό εύρημα αφορούσε τα λεγόμενα «χρυσού προτύπου» επείγοντα περιστατικά. Σε αυτές τις περιπτώσεις, όπου η ιατρική κοινότητα συμφωνεί ότι απαιτείται άμεση μεταφορά στα επείγοντα, το ChatGPT Health υποτίμησε τη σοβαρότητα στο 52% των σεναρίων. Δηλαδή, σε πάνω από τις μισές κρίσιμες καταστάσεις, δεν πρότεινε άμεση επίσκεψη σε τμήμα επειγόντων. Για παράδειγμα, σε σενάρια που περιέγραφαν διαβητική κετοξέωση (μια επικίνδυνη επιπλοκή του σακχαρώδους διαβήτη) ή επικείμενη αναπνευστική ανεπάρκεια, το σύστημα πρότεινε αξιολόγηση μέσα στις επόμενες 24–48 ώρες αντί για άμεση μετάβαση στο νοσοκομείο. Αντίθετα, σε «κλασικά» και ευρέως αναγνωρίσιμα επείγοντα, όπως εγκεφαλικό επεισόδιο ή αναφυλαξία, οι συστάσεις ήταν πιο συχνά σωστές.
Ένα άλλο σημαντικό στοιχείο της μελέτης ήταν η επίδραση του λεγόμενου «φαινομένου της αγκίστρωσης» (Το φαινόμενο αυτό περιγράφει την τάση των ανθρώπων να βασίζονται υπερβολικά στην πρώτη πληροφορία που λαμβάνουν την «άγκυρα» κατά τη λήψη αποφάσεων ή εκτιμήσεων, επηρεάζοντας αρνητικά τις επόμενες κρίσεις τους). Σε ορισμένα σενάρια, οι ερευνητές πρόσθεσαν μια φράση όπου ένα μέλος της οικογένειας ή ένας φίλος υποβάθμιζε τα συμπτώματα, λέγοντας για παράδειγμα «μάλλον είναι κάτι απλό». Διαπιστώθηκε ότι σε τέτοιες περιπτώσεις, ειδικά όταν το περιστατικό βρισκόταν «στα όρια» μεταξύ επείγοντος και μη επείγοντος, οι συστάσεις του συστήματος μεταβάλλονταν σημαντικά προς λιγότερο επείγουσα κατεύθυνση. Στατιστικά, η πιθανότητα αλλαγής της σύστασης ήταν πολύ αυξημένη, γεγονός που δείχνει ότι το σύστημα μπορεί να επηρεάζεται από το πλαίσιο της περιγραφής και όχι μόνο από τα ιατρικά δεδομένα.
Ιδιαίτερο ενδιαφέρον παρουσίασαν και τα αποτελέσματα σχετικά με την ψυχική υγεία και τον κίνδυνο αυτοκτονίας. Το ChatGPT Health διαθέτει ενσωματωμένους μηχανισμούς «κρίσης», που ενεργοποιούνται όταν εντοπίζονται εκφράσεις αυτοκτονικού ιδεασμού. Ωστόσο, η μελέτη έδειξε ότι η ενεργοποίηση αυτών των μηνυμάτων δεν ήταν σταθερή. Παραδόξως, σε ορισμένα σενάρια το σύστημα παρείχε πιο έντονα μηνύματα υποστήριξης όταν ο χρήστης δεν περιέγραφε συγκεκριμένο τρόπο αυτοκτονίας, σε σύγκριση με περιπτώσεις όπου αναφερόταν ρητά σε μέθοδο. Αυτή η ασυνέπεια εγείρει ερωτήματα για το πώς λειτουργούν οι μηχανισμοί ασφαλείας και κατά πόσο είναι επαρκώς ευαίσθητοι στις πιο επικίνδυνες καταστάσεις.
Η μελέτη εξέτασε επίσης αν παράγοντες όπως η φυλή, το φύλο ή τα εμπόδια πρόσβασης στην περίθαλψη επηρέαζαν τις συστάσεις. Δεν βρέθηκαν στατιστικά σημαντικές διαφορές, ωστόσο οι ερευνητές επισημαίνουν ότι τα διαστήματα εμπιστοσύνης δεν αποκλείουν την ύπαρξη κλινικά σημαντικών διαφορών. Με άλλα λόγια, δεν αποδείχθηκε με σαφήνεια κάποια μεροληψία, αλλά ούτε μπορεί να αποκλειστεί πλήρως.
Τι σημαίνουν όλα αυτά για τον απλό πολίτη; Πρώτον, ότι τέτοια εργαλεία μπορούν να προσφέρουν χρήσιμη καθοδήγηση, ιδιαίτερα σε περιπτώσεις χαμηλής ή μέτριας σοβαρότητας. Μπορούν να βοηθήσουν κάποιον να οργανώσει τη σκέψη του, να κατανοήσει πιθανούς κινδύνους και να αποφασίσει αν χρειάζεται ιατρική αξιολόγηση. Ωστόσο, η μελέτη δείχνει ξεκάθαρα ότι δεν μπορούν ακόμη να αντικαταστήσουν την κλινική κρίση ενός επαγγελματία υγείας, ιδίως σε ακραίες και δυνητικά απειλητικές για τη ζωή καταστάσεις.
Οι ερευνητές καταλήγουν ότι τα ευρήματά τους εγείρουν σοβαρές ανησυχίες για την ασφάλεια και υπογραμμίζουν την ανάγκη για περαιτέρω, προοπτικές μελέτες πριν από τη μαζική χρήση τέτοιων συστημάτων σε καταναλωτικό επίπεδο. Με απλά λόγια, η τεχνητή νοημοσύνη στην υγεία είναι ένα πολλά υποσχόμενο εργαλείο, αλλά χρειάζεται αυστηρό έλεγχο, διαφάνεια και συνεχή αξιολόγηση.
Το ChatGPT Health αντιπροσωπεύει ένα σημαντικό βήμα προς την ψηφιακή υποστήριξη της υγείας. Ταυτόχρονα, η μελέτη στο «Nature Medicine» λειτουργεί ως υπενθύμιση ότι όταν μιλάμε για ιατρικές αποφάσεις, η ακρίβεια και η αξιοπιστία δεν είναι απλώς τεχνικά χαρακτηριστικά αλλά είναι ζητήματα ζωής και θανάτου.
* Ο Δημήτριος Θεοδωρόπουλος είναι Φυσικός-Διδάκτορας Ιατρικής Σχολής Πανεπιστημίου Κρήτης / Εντεταλμένος Διδάσκων ΕΛΜΕΠΑ







































































































