Γεωργία Μανιάτη: Όταν Μιλάνε οι Μηχανές

Γεωργία Μανιάτη

Ποιες είναι οι γνώσεις σας για την τεχνητή νοημοσύνη; Ποια γλώσσα προγραμματισμού χρησιμοποιείτε; Ποιοι δημιουργούν αυτές τις εφαρμογές; Πώς επιδρούν στη ζωή μας και τι προκλήσεις έχουμε να αντιμετωπίσουμε στο μέλλον;

Στο φετινό Athens Science Festival, το οποίο πραγματοποιήθηκε πριν από λίγο καιρό στην Τεχνόπολη του Δήμου Αθηναίων, η Γεωργία Μανιάτη «χρησιμοποίησε» τη δική της γλώσσα, αφενός, για να κατανοήσουμε πώς κάνει τις μηχανές να μιλάνε και, αφετέρου, για να αποδεχτούμε τον σύγχρονο κόσμο μας που εξελίσσεται συνεχώς τεχνολογικά και πολλές φορές μας φαίνεται δυσνόητος.

Η Γεωργία Μανιάτη κατέχει πτυχίο Γλωσσολογίας (Φιλολογίας) από το ΕΚΠΑ. Προπτυχιακά, συμμετείχε στην ανάπτυξη του πρώτου υπολογιστικού εννοιολογικού λεξικού για τα ελληνικά στο Ινστιτούτο Επεξεργασίας του Λόγου του Ε.Κ. «Αθηνά».

Στη συνέχεια παρακολούθησε το M.Sc. στην Επεξεργασία Ομιλίας και Φυσικής Γλώσσας στο Πανεπιστήμιο του Εδιμβούργου, ένα πρόγραμμα που συνδύαζε τεχνητή νοημοσύνη, προγραμματισμό και γλωσσολογία. Από το 2017 εργάζεται στη Samsung Electronics, στην ερευνητική ομάδα Innoetics στην Αθήνα, για την ανάπτυξη συνθετικών φωνών για το ευρύ φάσμα συσκευών και όλη την γκάμα γλωσσών που υποστηρίζει η εταιρεία παγκοσμίως.

Με τη συνέντευξη αυτή μπήκαμε σε μια διαδικασία αναπαραγωγής ήχων και ανατροφοδότησης γνώσεων.

Τι είναι η υπολογιστική γλωσσολογία;

Συνήθως συστήνομαι ως υπολογιστική γλωσσολόγος στα ελληνικά, αφού ο όρος είναι διαφανής ως προς το υπόβαθρο των σπουδών μου. Στην πράξη, όμως, ασχολούμαι με την επεξεργασία ομιλίας και φυσικής γλώσσας.

Η τεχνολογία στην οποία ειδικεύομαι είναι η συνθετική ομιλία, ένα υποπεδίο της τεχνητής νοημοσύνης (ΤΝ), που επικεντρώνεται στη μετατροπή γραπτού κειμένου σε προφορικό λόγο. Η συνθετική ομιλία κάνει τις μηχανές να μιλάνε, εξελίσσοντας την αλληλεπίδραση του ανθρώπου με τον υπολογιστή από γραπτή σε προφορική.

Γνωστές εφαρμογές που χρησιμοποιούμε καθημερινά είναι το GPS, που μας μιλά δίνοντάς μας κατευθυντήριες οδηγίες, και η φωνητική βοηθός του τηλεφώνου μας.

«Μέσα από την εμπειρία μου στη γλωσσολογία, είχα τη χαρά να κατανοήσω πως οι λειτουργίες των γλωσσών ανά τον κόσμο μας δείχνουν τον τρόπο με τον οποίο οι ομιλητές βλέπουν τον κόσμο, αλλά και πως οι ίδιες βασικές αρχές διέπουν όλες τις ανθρώπινες γλώσσες».

Τι σας ώθησε να ακολουθήσετε μια σταδιοδρομία στην υπολογιστική γλωσσολογία και πώς ενδιαφερθήκατε για αυτόν τον τομέα;

Στο ξεκίνημα των σπουδών μου δεν γνώριζα για την ύπαρξη του συγκεκριμένου κλάδου. Το 2010 δεν είχαν αναπτυχθεί ακόμα οι περισσότερες πλέον γνωστές μας εφαρμογές γλωσσικής τεχνολογίας και δεν υπήρχε δημόσια συζήτηση για την τεχνητή νοημοσύνη (το Google Τranslate άρχισε να υποστηρίζει ελληνικά τον Δεκέμβριο του 2009 και το Μaps απέκτησε ελληνική φωνή το 2011).

Προπτυχιακά ειδικεύτηκα στη γλωσσολογία, αλλά ήρθα σε επαφή με την υπολογιστική γλωσσολογία σε ένα μάθημα επιλογής στη σχολή. Μέσα από την εμπειρία μου στη γλωσσολογία, είχα τη χαρά να κατανοήσω πως οι λειτουργίες των γλωσσών ανά τον κόσμο μας δείχνουν τον τρόπο με τον οποίο οι ομιλητές βλέπουν τον κόσμο, αλλά και πως οι ίδιες βασικές αρχές διέπουν όλες τις ανθρώπινες γλώσσες.

Αντιλήφθηκα πως τελικά η διάκριση σε θεωρητικές και τεχνολογικές σπουδές δεν είναι ουσιαστική. Αυτό που κυρίως ήθελα να κάνω ήταν να χρησιμοποιήσω τα υπολογιστικά εργαλεία για να αναλύω και να κατανοώ καλύτερα τη γλώσσα μέσω της διεπιστημονικότητας.

Με υποτροφία από το Ίδρυμα Ωνάση, ολοκλήρωσα το μεταπτυχιακό μου και με τα εφόδια που απέκτησα η απορρόφηση στη βιομηχανία των γλωσσικών τεχνολογιών ήταν άμεση.

Η υπολογιστική γλωσσολογία συχνά περιλαμβάνει έναν συνδυασμό γλωσσολογίας και επιστήμης υπολογιστών. Μπορείτε να περιγράψετε την προσέγγισή σας για να γεφυρώσετε αυτούς τους δύο κλάδους;

Ιστορικά, η επεξεργασία φυσικής γλώσσας ξεκίνησε να βασίζεται αποκλειστικά σε γλωσσολογικούς κανόνες, που οι ερευνητές μετέτρεπαν σε προγράμματα. Αυτή η προσέγγιση, όμως, δεν μπορούσε να εφαρμοστεί σε πραγματικά σενάρια.

Σήμερα, το μεθοδολογικό παράδειγμα στην ΤΝ απαιτεί τη συλλογή μεγάλων δεδομένων γλώσσας και την επισημείωσή τους για την εκπαίδευση κατάλληλων αλγορίθμων.

Συνοπτικά, η επιστήμη υπολογιστών και οι μηχανικοί μηχανικής μάθησης αναπτύσσουν τους αλγόριθμους, ενώ η γλωσσολογία δίνει την απαραίτητη γνώση του πεδίου που διαμορφώνει τα δεδομένα, τις επισημειώσεις τους, τα χαρακτηριστικά τους.

Ουσιαστικά, καθορίζει το είδος των αλγορίθμων που είναι βέλτιστοι για το πρόβλημα και καταδεικνύει τους τρόπους αξιολόγησης των μοντέλων. Η επιστήμη υπολογιστών, από την άλλη, παρέχει τα εργαλεία για την ανάπτυξη και την εφαρμογή των αλγορίθμων.

«Το GPT-3, που βασίστηκε σε τεράστια δεδομένα εκπαίδευσης αλλά και σε μια συγκεκριμένη οικογένεια αλγορίθμων, βελτίωσε σημαντικά την ικανότητα παραγωγής συνεκτικού και σχετικού με τα συμφραζόμενα κειμένου».

Γεωργία Μανιάτη

Ποιες είναι μερικές πρόσφατες εξελίξεις στην υπολογιστική γλωσσολογία που σας έχουν εντυπωσιάσει ιδιαίτερα και πώς βλέπετε να διαμορφώνουν το μέλλον του κλάδου;

Νομίζω τα μεγάλα γλωσσικά μοντέλα (LLMs) έχουν εντυπωσιάσει τους πάντες, εντός και εκτός κλάδου. Το GPT-3, που βασίστηκε σε τεράστια δεδομένα εκπαίδευσης αλλά και σε μια συγκεκριμένη οικογένεια αλγορίθμων, βελτίωσε σημαντικά την ικανότητα παραγωγής συνεκτικού και σχετικού με τα συμφραζόμενα κειμένου.

Ας μην ξεχνάμε, όμως, ότι αυτά τα μοντέλα δεν έχουν γνώση του κόσμου ή άλλων μορφών δεδομένων πέραν του κειμένου. Γι’ αυτό, μια εξέλιξη που θεωρώ πολύ σημαντική είναι η πρόοδος στην πολυτροπική μάθηση, ένα είδος εκπαίδευσης αλγορίθμων που συνδυάζει κείμενο με άλλες μορφές δεδομένων, όπως εικόνες, ήχο και βίντεο.

Αυτός ο συνδυασμός έχει ανοίξει τον δρόμο για την ανάπτυξη συστημάτων τεχνητής νοημοσύνης ικανών να κατανοούν και να ερμηνεύουν την ανθρώπινη επικοινωνία με πιο ολιστικό τρόπο, μιμούμενοι τον τρόπο με τον οποίο οι άνθρωποι επεξεργάζονται φυσικά τις πληροφορίες.

«Με την έλευση εργαλείων όπως το ChatGPT, που υποστηρίζουν τις «ισχυρές» μόνο γλώσσες και όχι τη συντριπτική πλειονότητα των 6-7.000 ομιλούμενων γλωσσών στη Γη, το ψηφιακό χάσμα και η ανισότητα των γλωσσών θα χειροτερεύσει λόγω έλλειψης αντίστοιχης τεχνολογίας».

Η επεξεργασία φυσικής γλώσσας (NLP) έχει κερδίσει ευρεία προσοχή. Ποιες είναι οι βασικές προκλήσεις που βλέπετε στο NLP και ποιες πιθανές λύσεις ή στρατηγικές προτείνετε;

Η βασική πρόκληση που βλέπω στο NLP και στην ανάπτυξη της γλωσσικής τεχνολογίας είναι ότι υπάρχουν γλώσσες δύο ταχυτήτων με ένα ψηφιακό χάσμα μεταξύ τους. Γλώσσες όπως τα αγγλικά τα κινεζικά, και περίπου δέκα γλώσσες ακόμα, έχουν μεγάλα ψηφιακά γλωσσικά δεδομένα, ικανά να εκπαιδεύσουν σύγχρονους αλγόριθμους επεξεργασίας φυσικής γλώσσας.

Με την έλευση εργαλείων όπως το ChatGPT, που υποστηρίζουν τις «ισχυρές» μόνο γλώσσες και όχι τη συντριπτική πλειονότητα των 6-7.000 ομιλούμενων γλωσσών στη Γη, το ψηφιακό χάσμα και η ανισότητα των γλωσσών θα χειροτερεύσει λόγω έλλειψης αντίστοιχης τεχνολογίας

Η δεύτερη μεγάλη πρόκληση που βλέπω είναι ηθική και αφορά στην εξάλειψη της πολυφωνίας στα παραγόμενα δεδομένα. Για την επιβίωση των γλωσσών και τη διατήρηση της πολυφωνίας θα πρέπει να διασφαλιστεί η ποικιλομορφία στα δεδομένα εκπαίδευσης.

Και αυτή με τη σειρά της θα προκύψει από τη συμπερίληψη γυναικών και άλλων υπο-εκπροσωπούμενων ομάδων στον σχεδιασμό των συστημάτων ΤΝ. Διαφορετικά, κινδυνεύουμε να κατασκευάσουμε συστήματα που αντανακλούν μια προνομιούχα οπτική της κοινωνίας, αυτή του «λευκού άνδρα», που συνήθως τα κατασκευάζει.

Αυτό που μπορούμε να κάνουμε άμεσα είναι να εξετάσουμε από τώρα πώς τα συστήματα ΤΝ δεν θα είναι μεροληπτικά, ώστε να είμαστε σε θέση να σχεδιάσουμε μια δίκαια και περισσότερο ανθρωποκεντρική ΤΝ στο μέλλον.

Ποιες μεθοδολογίες ή εργαλεία βρήκατε πιο αποτελεσματικά για την αξιοποίηση αυτών των τεχνολογιών στην εργασία σας;

Υπάρχουν πολλά διαθέσιμα εργαλεία που μπορούν να αξιοποιηθούν από κάποιον που ενδιαφέρεται να ανακαλύψει το NLP. Η γλώσσα προγραμματισμού Python χρησιμοποιείται ευρέως για την επεξεργασία ομιλίας και φυσικής γλώσσας.

Βιβλιοθήκες βασισμένες στην Python, όπως οι NLTK, spaCy και TensorFlow, είναι πολύ χρήσιμες για εργασίες όπως η επεξεργασία κειμένου, η γλωσσική ανάλυση και η ανάπτυξη μοντέλων. Επιτρέπουν έναν αποτελεσματικό και γρήγορο πειραματισμό σε πολλές φυσικές γλώσσες.

Ποιες συμβουλές ή συστάσεις θα δίνατε σε φοιτητές ή επαγγελματίες που θέλουν να εισέλθουν στον τομέα της υπολογιστικής γλωσσολογίας για να τους βοηθήσετε να επιτύχουν σε αυτόν τον τομέα; 

Αν θέλει κάποιος να ασχοληθεί με τον κλάδο, ένα μεταπτυχιακό σχετικό με την κατανόηση των βασικών γλωσσολογικών εννοιών και μοντέλων, των αρχών του προγραμματισμού και της μαθηματικής μοντελοποίησης, καθώς και των μεθόδων μηχανικής μάθησης, μπορεί να τον εφοδιάσει επαρκώς.

Σημαντικότερη όμως είναι η πρακτική εφαρμογή και η διάθεση για συνεχή εκπαίδευση και επιμόρφωση/αυτομόρφωση, αφού πρόκειται για έναν ερευνητικό τομέα που εξελίσσεται με πολύ γρήγορους ρυθμούς. Η συμμετοχή σε συνέδρια και η μελέτη επιστημονικών άρθρων σχετικά με τις τελευταίες τάσεις και τεχνολογικές προκλήσεις είναι απαραίτητη.

 

Διαβάστε επίσης στην αθηΝΕΑ:

Η Ευαγγελία Δρακοπούλου Μιλάει για τη Σχολική Διαμεσολάβηση

Μαρίνα Αρπλιά: «Ο Μόνος Τρόπος να Ξεχωρίσεις Είναι να Λύνεις ένα Πρόβλημα»

Μαρία Σαμπατακάκη: «Αρχειογραφείο Σημαίνει Μικρά, Ευέλικτα και Ορατά Αρχεία»

 

 

ΑΡΘΡΟΓΡΑΦΟΣ
We Are Family
We Are Family

Γεννήθηκε τον Μάρτιο του 1977. Μεγάλωσε και ζει στην Αθήνα. Ανήσυχη από πολύ μικρή, της άρεσαν η μουσική, τα γράμματα και ο αθλητισμός. Στα 18 σπούδασε αισθητική και αργότερα έγινε make-up artist δίπλα στον Αχιλλέα Χαρίτο. Αφού συνεργάστηκε πάνω από 15 χρόνια με διάφορες εταιρείες παραγωγής και διαφήμισης, τηλεοπτικά studios και wedding planners, ανακάλυψε πως θέλει να ασχοληθεί με θέματα που αφορούν τα παιδιά. Παρακολούθησε "εκπαιδευτικό δράμα" στο εργαστήρι της Ξένιας Καλογεροπούλου στο Θέατρο Πόρτα και άρχισε να της δίνεται η έμπνευση για ιστορίες και παραμύθια που αφορούν ρόλους για παιδιά. Στη συνέχεια παρακολούθησε εργαστήρια ψυχολογίας γιατί την ενδιέφεραν οι διάφορες συμπεριφορές που διαμορφώνονται στους μικρούς μας φίλους, καθώς απέκτησε και η ίδια δύο γιους. Σήμερα σπουδάζει μονωδία-κλασσικό τραγούδι και ευελπιστεί να καταφέρει να πάρει το γρηγορότερο δυνατό το πτυχίο της. Συμμετέχει στο φωνητικό σύνολο "Eclipsis" και περνάει όμορφες εμπειρίες στη διάρκεια των προβών.

ΑΝΑΖΗΤΗΣΗ

Τα σημαντικότερα νέα της ημέρας, στο inbox σου κάθε μεσημέρι!

ΕΓΓPΑΦΕΙΤΕ ΣΤΟ NEWSLETTER

+