Σήμερα, διάφοροι αλγόριθμοι χρησιμοποιούνται στην ιατρική για τη διάγνωση παθήσεων, την εκτίμηση της πρόγνωσης των ασθενών ή άλλες χρήσεις. Τα τελευταία χρόνια έχουν ακουστεί αρκετά περιστατικά όπου η χρήση αλγορίθμων είχε αρνητικά αποτελέσματα. Για παράδειγμα, ένας αλγόριθμος απέτυχε να διαγνώσει περισσότερα από 100 περιστατικά σήψης, ενώ ένα άλλο λογισμικό έκρινε ότι ορισμένοι ασθενείς δεν είχαν ανάγκη περισσότερες θεραπείες, κάτι που τελικά αποδείχθηκε ότι δεν ήταν αληθές. Το πρόβλημα αυτό φυσικά έχει επηρεάσει και την πανδημία της COVID-19. Μία μελέτη που εξέτασε 232 αλγορίθμους μηχανικής μάθησης διαπίστωσε ότι κανένας από αυτούς δεν είχε χρησιμότητα στην κλινική πράξη.

Το γεγονός που προκαλεί ανησυχία είναι ότι κανένας από τους παραπάνω αλγορίθμους δεν έλαβε έγκριση από το FDA ή κάποιο άλλο ελεγκτικό φορέα, με αρκετούς από αυτούς να μην έχουν δοκιμαστεί καν σε κλινικές δοκιμές.

Για να κατανοήσουμε καλύτερα τα αίτια του παραπάνω προβλήματος, αν εξετάσουμε την πρόσφατη ιστορία. Το 1976, μετά την αποτυχία του Dalkon Shield, μίας ελαττωματικής ενδομήτριας συσκευής αντισύλληψης η οποία συνδέθηκε με δεκάδες θανάτους και χιλιάδες νοσηλείες, το Κογκρέσο των ΗΠΑ ψήφισε το Food, Drug and Cosmetics Act. Σύμφωνα με το νόμο αυτό, προκειμένου ένα ιατρικό εργαλείο να μπορεί να κυκλοφορήσει στην αγορά θα πρέπει να υπάρχουν επαρκή δεδομένα για την ασφάλεια και την αποτελεσματικότητά του από κλινικές δοκιμές. Καθώς εκείνη την εποχή κυκλοφορούσαν ήδη χιλιάδες ιατρικά εργαλεία, δημιουργήθηκε ο ελεγκτικός μηχανισμός 510(k) με σκοπό να επιταχυνθεί η έγκρισή τους. Προκειμένου ένα ιατρικό εργαλείο να εγκριθεί μέσω του παραπάνω μηχανισμού θα έπρεπε απλά να αποδείξει ότι είχε παρόμοια υλικά, μηχανισμό δράσης και ένδειξη χρήσης με ένα άλλο εργαλείο που είχε ήδη εγκριθεί και κυκλοφορούσε στην αγορά, χωρίς να χρειάζεται να προσκομίσει δεδομένα κλινικών δοκιμών. Εκείνη την εποχή, η προσέγγιση αυτή είχε θεωρηθεί αρκετά λογική. Για παράδειγμα, αν μία εταιρία θέλει να παρασκευάσει χειρουργικά γάντια, γιατί θα πρέπει να κάνει κλινικές δοκιμές αν ήδη έχουν εγκριθεί και κυκλοφορούν άλλα γάντια στην αγορά; Έτσι κι αλλιώς όλα τα γάντια είναι ίδια, σωστά;

Φυσικά, τα ιατρικά εργαλεία σταδιακά έγιναν πιο σύνθετα. Μέσα σε λίγα χρόνια αρχίσαμε να χρησιμοποιούμε ρομπότ στα χειρουργεία, ενώ τα στηρίγματα στα γόνατα αντικαταστάθηκαν από προσθετικά γόνατα. Τελικά, η ταχεία εξέλιξη της τεχνολογίας στον τομέα της ιατρικής έκανε ιδιαίτερα δύσκολο να μπορούμε να ξεχωρίσουμε αν δύο συσκευές είναι «παρόμοιες». Ως αποτέλεσμα, η κυβέρνηση του George W. Bush έλαβε μία αμφιλεγόμενη απόφαση το 2002. Συγκεκριμένα, τροποποίησε τον ορισμό του «παρόμοιου εργαλείου» έτσι ώστε να περιλαμβάνει και εργαλεία με σημαντικές διαφορές στο μηχανισμό δράσης, τα οποία ωστόσο είχαν παρόμοια ασφάλεια. Ο στόχος ήταν να διευκολυνθεί η ανάπτυξη νέων τεχνολογιών, ωστόσο σταδιακά, αυτό είχε ως αποτέλεσμα να εγκριθούν πολλά εργαλεία με μειωμένη αποτελεσματικότητα και κακό προφίλ ασφάλειας.

Μάλιστα, ένα άλλο σημαντικό πρόβλημα ήταν ότι ένα εργαλείο που είχε εγκριθεί μέσω του μηχανισμού 510(k) παρέμενε στην αγορά, ακόμα κι το εργαλείο με το οποίο συγκρίθηκε αποσυρόταν από την αγορά για λόγους ποιότητας ή ασφάλειας. Ως αποτέλεσμα, παρουσιάστηκε ένα επικίνδυνο φαινόμενο με αρκετά νοσοκομεία να χρησιμοποιούν ακόμα εργαλεία που είχαν βασιστεί για την έγκρισή τους σε προηγούμενα εργαλεία που ανακλήθηκαν. Από τα συνολικά 5.362 εργαλεία που ανακλήθηκαν στο διάστημα 2008-2017, το 97% είχε λάβει έγκριση μέσω του μηχανισμού 510(k).

Τελικά, όπως φαίνεται η εξέλιξη της τεχνολογίας πρέπει να συνοδεύεται πάντοτε από αλλαγές και στους ελεγκτικούς μηχανισμούς. Είναι προφανές ότι η ευρεία χρήση των ιατρικών αλγορίθμων θα πρέπει να ελεγχθεί, καθώς αυτοί ουσιαστικά αποτελούν τα ιατρικά εργαλεία της εποχής μας. Ο έλεγχος αυτός μπορεί να γίνει με 2 απλές προσεγγίσεις.

Πρώτον, θα πρέπει να διευρυνθεί ο ρόλος των ελεγκτικών φορέων όπως το FDA. Ιδιαίτερα για τους ιατρικούς αλγορίθμους, θα πρέπει να διευκρινιστεί ότι προκειμένου να μπορεί να εγκριθεί μέσω του μηχανισμού 510(k), ο αλγόριθμος θα πρέπει να χρησιμοποιεί τις ίδιες τεχνικές μηχανικής μάθησης και την ίδια βάση δεδομένων με κάποιον που έχει ήδη εγκριθεί. Το γεγονός αυτό θα αποτρέψει την έγκριση αλγορίθμων που χρησιμοποιούνται για τον ίδιο σκοπό, αλλά βασίζονται σε διαφορετικό μηχανισμό. Επιπλέον, οι αλγόριθμοι κλινικών αποφάσεων που χρησιμοποιούνται σήμερα ευρέως στα νοσοκομεία αρκετών χωρών θα πρέπει επίσης να έχουν εγκριθεί από το FDA. Αν και οι αλγόριθμοι αυτοί δεν θα πρέπει να χρησιμοποιούνται ως μοναδικό εργαλείο για τη λήψη κλινικών αποφάσεων, αρκετοί γιατροί βασίζονται σχεδόν αποκλειστικά σε αυτούς, γεγονός που σίγουρα επηρεάζει την πρόγνωση των ασθενών.

Δεύτερον, είναι προφανές ότι θα πρέπει να μπορεί να αποδοθεί ευθύνη σε αυτούς που αναπτύσσουν την τεχνολογία του κάθε αλγορίθμου, ιδιαίτερα καθώς ο τελευταίος εξελίσσεται. Σε ορισμένες χώρες, μεταξύ των οποίων και οι ΗΠΑ, αυτό έχει ήδη δρομολογηθεί. Πριν από λίγα χρόνια, προτάθηκε για πρώτη φορά το Algorithmic Accountability Act. Σύμφωνα με τον παραπάνω νόμο, οι εταιρίες που κατασκευάζουν συστήματα αυτοματοποιημένων κλινικών αποφάσεων (με τη χρήση αλγορίθμων) θα πρέπει να περνούν τακτικά ελέγχους προκειμένου να διασφαλιστεί ότι τα προϊόντα τους παραμένουν αποτελεσματικά και ασφαλή στην κλινική πράξη. Προφανώς, κάθε αλλαγή στον αλγόριθμο θα πρέπει να περνά ξανά από έλεγχο.

Σήμερα είναι γνωστό ότι οι αλγόριθμοι που χρησιμοποιούνται στην υγεία συχνά μπορεί να είναι αναποτελεσματικοί ή μεροληπτικοί. Ωστόσο, με την εφαρμογή των προαναφερθέντων προσεγγίσεων το παραπάνω πρόβλημα μπορεί να αποφευχθεί. Ο γιατρός δεν θα πρέπει να ξεχνά ότι ο κύριος στόχος του είναι να προστατεύσει την υγεία του ασθενούς. Προφανώς αυτό συνεχίζει να ισχύει και όταν χρησιμοποιεί αλγορίθμους.