Η εξέλιξη του Siri με ένα μοντέλο AI επεξεργασίας εικόνων ανοιχτού κώδικα που λειτουργεί με κείμενο από την Apple


Υπάρχουν συνεχείς φήμες ότι η Apple σκοπεύει να φέρει κάποιες μεγάλες βελτιώσεις στο Siri αργότερα φέτος. Έχουμε ακούσει πολλές φορές ότι η Apple εργάζεται σε νέα μοντέλα μεγάλων γλωσσών (LLM) που θα μπορούσαν να δουν τις συσκευές της να αποκτούν νέες δυνατότητες AI, τις οποίες καμία πλατφόρμα της Apple δεν μπορεί να καυχηθεί μέχρι

. Η ίδια η Apple έχει ήδη επιβεβαιώσει ότι αφιερώνει χρόνο σε πρωτοβουλίες τεχνητής νοημοσύνης χωρίς να δίνει τίποτα και τώρα κυκλοφόρησε ένα

εργαλείο τεχνητής νοημοσύνης ανοιχτού κώδικα που μπορεί να μην χρησιμοποιείται από πολλούς, αλλά μας δίνει μια υπόδειξη για τα πράγματα που έχει επικεντρώσει η Apple επί.

Η Apple δημιούργησε σήμερα ένα νέο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα που μπορεί να επεξεργάζεται εικόνες με βάση τις οδηγίες κειμένου που της παρέχονται. Το μοντέλο μπορεί να κάνει διάφορα πράγματα όταν εκτελεί αυτές τις επεξεργασίες, συμπεριλαμβανομένων διαφόρων πραγμάτων που κανονικά κάποιοι άνθρωποι θα στρέφονταν σε αποκλειστικές εφαρμογές για να κάνουν.

Με την επωνυμία MGI ή MLLM-Guided Image Editing, το εργαλείο χρησιμοποιεί πολυτροπικά LLM για να μετατρέψει τις εντολές που βασίζονται σε κείμενο σε επεξεργασίες σε επίπεδο pixel, οι οποίες με τη σειρά τους φτύνουν μια τροποποιημένη εικόνα. Παραδείγματα του τι θα μπορούσαν να κάνουν οι άνθρωποι είναι να ζητήσουν από το MGIE να αλλάξει τα χρώματα μιας εικόνας ή να αλλάξει τον κορεσμό.

MGIE μαγεία


VentureBeat

λεπτομερώς το νέο εργαλείο MGIE, λέγοντας ότι μπορεί να εκτελέσει πολλές από τις εργασίες που κάνουν τακτικά οι άνθρωποι με εφαρμογές όπως το

. «Το MGIE μπορεί να εκτελεί κοινές επεξεργασίες σε στυλ Photoshop, όπως περικοπή, αλλαγή μεγέθους, περιστροφή, αναστροφή και προσθήκη φίλτρων», εξηγεί η αναφορά. “Το μοντέλο μπορεί επίσης να εφαρμόσει πιο προηγμένες επεξεργασίες, όπως αλλαγή φόντου, προσθήκη ή αφαίρεση αντικειμένων και ανάμειξη εικόνων.”

Δεν είναι μόνο αυτό. Το MGIE μπορεί στη συνέχεια να “βελτιστοποιήσει τη συνολική ποιότητα μιας φωτογραφίας, όπως φωτεινότητα, αντίθεση, ευκρίνεια και ισορροπία χρωμάτων. Το μοντέλο μπορεί επίσης να εφαρμόσει καλλιτεχνικά εφέ όπως σκίτσο, ζωγραφική και κινούμενα σχέδια.”

Ούτε αυτό είναι όλο. Οι χρήστες μπορούν να ζητήσουν από το εργαλείο να επεξεργαστεί συγκεκριμένες περιοχές μερών ενός αντικειμένου, όπως το

ενός ατόμου ή τα ρούχα του, ενώ «το μοντέλο μπορεί επίσης να τροποποιήσει τα χαρακτηριστικά αυτών των περιοχών ή αντικειμένων, όπως σχήμα, μέγεθος, χρώμα, υφή και στυλ .”

Το εργαλείο MGIE είναι επί του παρόντος ένα έργο ανοιχτού κώδικα που διατίθεται μέσω Github και

υπάρχει ένα demo

που μπορεί να χρησιμοποιηθεί για να πάρει το μοντέλο για περιστροφή. Δεν είναι τέλειο, αλλά εξακολουθεί να είναι εντυπωσιακό ακόμα και στην τρέχουσα beta μορφή του.

Όσο για το πώς αυτό θα ωφελήσει τους χρήστες της Apple και του Siri στο μέλλον δεν είναι άμεσα σαφές, αλλά είναι μια ένδειξη της δουλειάς που κάνει η εταιρεία. Ωστόσο, υπάρχουν δυνατότητες που μας κάνουν να πάνε έξω, μεταξύ των οποίων η δυνατότητα σύνδεσης αυτού του είδους της ικανότητας τεχνητής νοημοσύνης στις Συντομεύσεις — επιτρέποντας ενδεχομένως τις εισαγωγές βάσει κειμένου να αλλάξουν τις εικόνες που είναι αποθηκευμένες στην εφαρμογή Φωτογραφίες. Εκείνοι που ίσως κατακλύζονται από τις επιλογές επεξεργασίας στην εφαρμογή Φωτογραφίες θα μπορούσαν επίσης να στραφούν στο να πουν απλώς στη Siri τι θέλουν, με τον ψηφιακό βοηθό να τροφοδοτεί αυτές τις πληροφορίες σε μια προηγμένη έκδοση του MGIE.

Είναι ακόμα πολύ νωρίς, γι’ αυτό, δεν υπάρχει αμφιβολία. Αλλά με την Apple να κάνει δυνητικά μεγάλα βήματα τεχνητής νοημοσύνης με το επερχόμενο iOS 18 και το

ειδικά κατάλληλο για την έκδοση προφορικών οδηγιών σε κάτι σαν το Siri, υπάρχει ελπίδα για μεγάλες αλλαγές στον ψηφιακό βοηθό φέτος.

Η Apple αναμένεται να κάνει προεπισκόπηση του λογισμικού iOS 18 μαζί με τις νέες ενημερώσεις λογισμικού Mac, iPad, Apple Watch και Apple TV αυτόν τον Ιούνιο. Είναι πιθανό να δούμε και το visionOS 2.0, με όλες τις νέες ενημερώσεις να είναι πιθανό να κυκλοφορήσουν στο κοινό το φθινόπωρο.


Περισσότερα από το iMore


VIA:

iMore.com


Follow TechWar.gr on Google News


Leave A Reply



Cancel Reply

Your email address will not be published.