Modern technology gives us many things.

Τα συστήματα AI θα πρέπει να περιλαμβάνουν αφρικανικές γλώσσες

Υπάρχουν πάνω 7.000 γλώσσες σε όλο τον κόσμο, σχεδόν τα μισά από τα οποία θεωρούνται είτε απειλούμενα είτε εξαφανισμένα. Εν τω μεταξύ, μόνο ένας συγκριτικά μικρός αριθμός από αυτά υποστηρίζονται από προγράμματα τεχνητής νοημοσύνης επεξεργασίας φυσικής γλώσσας (NLP), όπως το Siri, το Alexa ή το ChatGPT. Ιδιαίτερα αγνοούνται οι ομιλητές αφρικανικών διαλέκτων, οι οποίοι αντιμετωπίζουν εδώ και καιρό συστημικές προκαταλήψεις μαζί με άλλες περιθωριοποιημένες κοινότητες στον κλάδο της τεχνολογίας. Για να βοηθήσουν στην αντιμετώπιση των ανισοτήτων που πλήττουν δισεκατομμύρια ανθρώπους, μια ομάδα ερευνητών στην Αφρική εργάζεται για να δημιουργήσει ένα σχέδιο δράσης για την καλύτερη ανάπτυξη της τεχνητής νοημοσύνης που μπορεί να υποστηρίξει αυτές τις εξαιρετικά παραμελημένες γλώσσες.

Οι προτάσεις φτάνουν χάρη στα μέλη του Μασαχάνε (χονδρικά μεταφρασμένο σε «Χτίζουμε μαζί» στο isiZulu), μια οργάνωση βάσης αφιερωμένη στην προώθηση της έρευνας NLP στις αφρικανικές γλώσσες, «για Αφρικανούς, από Αφρικανούς». Όπως αναλύεται σε μια νέα εργασία που δημοσιεύτηκε σήμερα στο Μοτίβαη ομάδα εξέτασε αφρικανούς γλωσσολόγους, συγγραφείς, εκδότες, μηχανικούς λογισμικού και ηγέτες επιχειρήσεων για να εντοπίσει πέντε βασικά θέματα που πρέπει να ληφθούν υπόψη κατά την ανάπτυξη αφρικανικών εργαλείων NLP.

[Related: AI plagiarism detectors falsely flag non-native English speakers.]

Πρώτον, η ομάδα δίνει έμφαση στην Αφρική ως μια πολύγλωσση κοινωνία (η Masakhane υπολογίζει ότι πάνω από 2.000 από τις γλώσσες του κόσμου προέρχονται από την ήπειρο) και αυτές οι γλώσσες είναι ζωτικής σημασίας για τις πολιτιστικές ταυτότητες και την κοινωνική συμμετοχή. Υπάρχουν πάνω 200 εκατομμύρια ηχεία της Σουαχίλι, για παράδειγμα, ενώ 45 εκατομμύρια άνθρωποι μιλούν Γιορούμπα.

Δεύτερον, οι συγγραφείς τονίζουν ότι η ανάπτυξη της κατάλληλης υποστήριξης για τη δημιουργία αφρικανικού περιεχομένου είναι ζωτικής σημασίας για την επέκταση της πρόσβασης, συμπεριλαμβανομένων εργαλείων όπως ψηφιακά λεξικά, ορθογραφικοί έλεγχοι και πληκτρολόγια που υποστηρίζονται από αφρικανική γλώσσα.

Αναφέρουν επίσης ότι οι πολυεπιστημονικές συνεργασίες μεταξύ γλωσσολόγων και επιστημόνων υπολογιστών είναι το κλειδί για τον καλύτερο σχεδιασμό εργαλείων και λένε ότι οι προγραμματιστές θα πρέπει να έχουν υπόψη τους τις ηθικές υποχρεώσεις που συνεπάγονται η συλλογή δεδομένων, η επιμέλεια και η χρήση.

«Δεν έχει νόημα για μένα ότι υπάρχουν περιορισμένα εργαλεία τεχνητής νοημοσύνης για αφρικανικές γλώσσες. Η συμπερίληψη και η εκπροσώπηση στην πρόοδο της γλωσσικής τεχνολογίας δεν είναι ένα μπάλωμα που βάζετε στο τέλος – είναι κάτι που σκέφτεστε εκ των προτέρων», δήλωσε την Παρασκευή η Kathleen Siminyu, η πρώτη συγγραφέας της εφημερίδας και ερευνήτρια τεχνητής νοημοσύνης στο Masakhane Foundation.

[Related: ChatGPT’s accuracy has gotten worse, study shows.]

Μερικές από τις άλλες συστάσεις της ομάδας περιλαμβάνουν πρόσθετη δομική υποστήριξη για την ανάπτυξη εργαλείων εποπτείας περιεχομένου που θα βοηθήσουν στον περιορισμό της εξάπλωσης παραπληροφόρησης που βασίζεται στη διαδικτυακή αφρικανική γλώσσα, καθώς και χρηματοδότηση νομικών υποθέσεων που αφορούν χρήση δεδομένων αφρικανικής γλώσσας από μη αφρικανικές εταιρείες.

«Θα ήθελα πολύ να ζούμε σε έναν κόσμο όπου οι Αφρικανοί μπορούν να έχουν εξίσου καλή ποιότητα ζωής και πρόσβαση σε πληροφορίες και ευκαιρίες όσο κάποιος που μιλάει άπταιστα Αγγλικά, Γαλλικά, Μανδαρινικά ή άλλες γλώσσες», συνεχίζει ο Siminyu. Στο μέλλον, η ομάδα ελπίζει να επεκτείνει τη μελέτη της ώστε να περιλαμβάνει ακόμη περισσότερους συμμετέχοντες και να χρησιμοποιήσει την έρευνά τους για να βοηθήσει ενδεχομένως στη διατήρηση των αυτόχθονων αφρικανικών γλωσσών.

“[W]νιώθω ότι αυτές είναι προκλήσεις που μπορούν και πρέπει να αντιμετωπιστούν». Μοτίβα’ Ο επιστημονικός συντάκτης Wanying Wang γράφει στο συνοδευτικό άρθρο του τεύχους. Ο Wang ελπίζει επίσης ότι επιπλέον ερευνητές θα υποβάλουν τις δικές τους εξερευνήσεις και προόδους σε μη αγγλικό NLP.

“Αυτό δεν περιορίζεται μόνο σε πρωτοποριακές τεχνικές προόδους και λύσεις NLP, αλλά και ανοιχτό σε ερευνητικές εργασίες που χρησιμοποιούν αυτές ή παρόμοιες τεχνολογίες για να ωθήσουν τα όρια γλώσσας και τομέα”, γράφει ο Wang.





https://www.popsci.com/

Follow TechWar.gr on Google News

Απάντηση