Ο εντοπισμός ανεπιθύμητων μηνυμάτων του Gmail έχει λάβει τις «μεγαλύτερες αμυντικές αναβαθμίσεις» του
Ο αποκλεισμός των ανεπιθύμητων μηνυμάτων ηλεκτρονικού ταχυδρομείου είναι μια συνεχής μάχη που εξελίσσεται συνεχώς και η τελευταία τεχνική του Gmail έχει ως αποτέλεσμα 38% ενίσχυση στον εντοπισμό χάρη στην καλύτερη αναγνώριση κειμένου.
Οι αποστολείς ανεπιθύμητης αλληλογραφίας συχνά χρησιμοποιούν ομόγλυφα (χαρακτήρες που μοιάζουν με τα πραγματικά γράμματα), αόρατους χαρακτήρες, γεμίσματα λέξεων-κλειδιών και άλλους «αντιπαθητικούς χειρισμούς κειμένου» για να παρακάμψουν τα μοντέλα ταξινόμησης κειμένου του Gmail που εντοπίζουν επιθέσεις phishing, απάτες και άλλο επιβλαβές περιεχόμενο.
Ανοιχτού κώδικα
από την
Google
Research
, αυτή η προσέγγιση «βοηθά τα μοντέλα να επιτύχουν κορυφαία απόδοση ταξινόμησης και μειώνει δραστικά το υπολογιστικό κόστος», ενώ υποστηρίζει «κάθε γλώσσα και όλους τους χαρακτήρες UTF-8 χωρίς την ανάγκη προεπεξ
εργασία
ς κειμένου». Αυτό το καθιστά ιδανικό για χρήση στη
συσκευή
, στον ιστό και άλλες περιπτώσεις χρήσης μεγάλης κλίμακας:
-
«Τα μοντέλα που εκπαιδεύονται με το RETVec μπορούν να είναι
μετατρέπεται απρόσκοπτα σε TFLite
για κινητές συσκευές και συσκευές αιχμής, ως αποτέλεσμα μιας εγγενούς υλοποίησης στο TensorFlow Text. Για την ανάπτυξη του
μοντέλο
υ εφαρμογής web, παρέχουμε μια υλοποίηση επιπέδου TensorflowJS που είναι διαθέσιμη στο Github και μπορείτε να δείτε ένα
δοκιμαστική ιστοσελίδα
τρέχοντας ένα μοντέλο που βασίζεται στο RETVec.”

Στο Gmail, το RETVec βελτίωσε το “ποσοστό ανίχνευσης ανεπιθύμητης αλληλογραφίας κατά τη βασική γραμμή κατά 38%,” ενώ μείωσε τόσο το ποσοστό ψευδώς θετικών (κατά 19,4%) όσο και τη χρήση της μονάδας επεξεργασίας τανυστή (κατά 83%).
Το RETVec επιτυγχάνει αυτές τις βελτιώσεις φορώντας ένα πολύ ελαφρύ μοντέλο ενσωμάτωσης λέξης (~200k παράμετροι), επιτρέποντάς μας να μειώσουμε το μέγεθος του μοντέλου Transformer με ίση ή καλύτερη απόδοση και έχοντας τη δυνατότητα να χωρίσουμε τον υπολογισμό μεταξύ του κεντρικού υπολογιστή και του TPU σε ένα δίκτυο και μνήμη αποτελεσματικός τρόπος.

Η Google λέει ότι έχει «δοκιμάσει εκτενώς το RETVec» τον περασμένο χρόνο «και το βρήκε εξαιρετικά αποτελεσματικό για εφαρμογές ασφάλειας και κατά της κατάχρησης».
Εάν θέλετε να χρησιμοποιήσετε το RETVec για δικές σας περιπτώσεις χρήσης ή έρευνα, δημιουργήσαμε ένα
φροντιστήριο
για να σας βοηθήσει να ξεκινήσετε.
VIA:
9to5google.com