Η Apple παρουσιάζει το εργαλείο τεχνητής νοημοσύνης που εκτελεί περίπλοκες επεξεργασίες εικόνας από μηνύματα κειμένου



Robert Triggs / Android Authority

TL;DR

  • Η Apple έχει συν-δημιουργήσει ένα μοντέλο τεχνητής νοημοσύνης που μπορεί να εκτελεί προηγμένες επεξεργασίες σε εικόνες με βάση τα μηνύ

    α κειμένου.
  • Το MGIE μπορεί να αλλάξει εντελώς μια εικόνα εκτελώντας επεξεργασίες όπως αν

    κατάσταση φόντου, χειρισμός θεμάτων, αφαίρεση αντικειμένων και πολλά άλλα.
  • Το μοντέλο AI παρουσιάστηκε σε μια ερευνητική εργασία και δεν είναι κάτι που περιμένουμε να δούμε σύντομα σε ένα iPhone.

Η Apple και ερευνητές από το Πανεπιστήμιο της Καλιφόρνια, Σάντα Μπάρμπαρα, δημιούργησαν από κοινού ένα εργαλείο τεχνητής νοημοσύνης που είναι ικανό να εκτελεί επεξεργασίες εικόνας με βάση τα μηνύματα κειμένου (μέσω


Venture Beat


).

Ονομάστηκε “MGIE”, το AI παρουσιάστηκε

ένα χαρτί

στο International Conference on

Representations 2024. Είναι ένα πολυτροπικό μοντέλο μεγάλης γλώσσας, όπως το Google Gemini, που μπορεί να επεξεργάζεται εικόνες όπως θα κάνατε στο Photoshop. Μόνο εδώ, μπορείτε να εκφράσετε τις σκέψεις σας σε κείμενο και το AI θα κάνει όλη τη δουλειά επεξεργασίας για εσάς.

Ας πούμε ότι έχετε μια εικόνα μιας πίτσας. Μπορείτε να πείτε στο MGIE «να το κάνει πιο υγιεινό» και θα προσθέσει πιο υγιεινές επικαλύψεις στην πίτα της εικόνας. Η συγγραφική εργασία της Apple παρουσιάζει επίσης άλλες περιπτώσεις χρήσης επεξεργασίας όπου μπορείτε να αφαιρέσετε αντικείμενα από εικόνες, να αλλάξετε χρώματα και να βελτιώσετε τον φωτισμό και άλλες λεπτομέρειες μιας εικόνας. Μπορεί ακόμη και να μετατρέψει ένα δασικό μονοπάτι σε παραλία, να αλλάξει το φόντο των φωτογραφιών, να δημιουργήσει καλλιτεχνικά σκίτσα και πολλά άλλα. Σκεφτείτε το Magic Editor της Google για τα στεροειδή. Μπορείτε να δείτε παραδείγματα των δυνατοτήτων επεξεργασίας του MGIE

εδώ

.

MGIE Apple

«Το MGIE αποτελείται από ένα MLLM (Multimodal Large Language Model) και ένα μοντέλο διάχυσης. Το MLLM μαθαίνει να αντλεί συνοπτικές, εκφραστικές οδηγίες και προσφέρει ρητή οπτική καθοδήγηση. Το μοντέλο διάχυσης ενημερώνεται από κοινού και εκτελεί επεξεργασία εικόνας», εξηγεί η

.

Δεν μπορούμε να πούμε πώς η Apple σχεδιάζει να χρησιμοποιήσει αυτές τις γνώσεις σε πραγματικά εργαλεία επεξεργασίας εικόνων που αντιμετωπίζουν οι καταναλωτές. Γνωρίζουμε ότι η εταιρεία εργάζεται σε δυνατότητες παραγωγής τεχνητής νοημοσύνης για τις πλατφόρμες της. Είναι πιθανό να δούμε εργαλεία επεξεργασίας που βασίζονται σε AI στη νέα σειρά iPhone 16. Παρόλο που υποθέτουμε ότι οι εκτεταμένες δυνατότητες επεξεργασίας του MGIE μπορεί να χρειάζονται μια υγιή ποσότητα επεξεργασίας, έτσι η Apple μπορεί να παρουσιάσει μια πιο ήπια έκδοση της τεχνητής νοημοσύνης εάν και όταν εφαρμόζεται σε iPhone.

Εάν ενδιαφέρεστε να δοκιμάσετε το MGIE, μπορείτε να δείτε μια επίδειξη που φιλοξενείται

εδώ

.


VIA:

AndroidAuthority.com


Follow TechWar.gr on Google News


Leave A Reply



Cancel Reply

Your email address will not be published.