Νέο επεξεργαστής εικόνων της Apple με τεχνητή νοημοσύνη
Το μοντέλο επεξεργασίας εικόνων με χρήση τεχνητής νοημοσύνης της Apple κυκλοφόρησε και ονομάζεται MGIE,
μι
α συντομογραφία για την επεξεργασία εικόνων καθοδηγούμενη από πολυτροπικά μοντέλα μεγάλων γλωσσών.
Πρόκειται για ένα εργαλείο σε πρώιμη ακόμα μορφή που είναι προς το παρόν διαθέσιμο μόνο στο GitHub. Πιθανότατα δεν θα το δούμε σε καμία συσκευή της εταιρείας, ωστόσο είναι ένα δείγμα του τι ετοιμάζει η Apple για το μέλλον.
Για να το χρησιμοποιήσεις πρέπει να δώσεις οδηγίες με γραπτό κείμενο για την αλλαγή και την επεξεργασία εικόνων. Μπορεί να κάνει απλές εργασίες επεξεργασίας εικόνας όπως η αύξηση της αντίθεσης ή της φωτεινότητας και η αλλαγή της ισορροπίας λευκού. Μπορεί, όμως, να ακολουθήσει και πιο σύνθετες εντολές, ό
πως να
κάνει την εικόνα μιας πίτσας να φαίνεται πιο υγιεινή προσθέτοντας περισσότερα λαχανικά από πάνω, για παράδειγμα.
Το μοντέλο MGIE, στο οποίο η Apple συνεργάστηκε με το Πανεπιστήμιο της Καλιφόρνιας στη Σάντα Μπάρμπαρα, μπορεί να προχωρήσει σε περικοπές και σε αλλαγές μεγέθους να συμπληρώσει αυτό
ματ
α περιγράμματα εικόνας, να αλλάξει τα μαλλιά, τα μάτια και τα
ρούχα
του υποκειμένου και να αφαιρέσει αντικείμενα.
“Αντί για μια σύντομη αλλά διφορούμενη καθοδήγηση, το MGIE αντλεί μια σαφή πρόθεση με οπτική επίγνωση και οδηγεί σε λογική επεξεργασία εικόνας. Διεξάγουμε εκτεταμένες μελέτες από διάφορες πτυχές της επεξεργασίας και αποδεικνύουμε ότι το MGIE μας βελτιώνει αποτελεσματικά την απόδοση, διατηρώντας παράλληλα την ανταγωνιστική αποδοτικότητα. Πιστεύουμε επίσης ότι το πλαίσιο καθοδήγησης MLLM μπορεί να συμβάλει στη μελλοντική έρευνα για την
όραση
και τη γλώσσα“, αναφέρουν οι ερευνητές στη δημοσίευση.
Παρόμοια άρθρα

