Το ChatGPT θα υποστηρίζει δωρεάν φωνητικές προτροπές και εικόνες

Νόμιζα ότι η Google έφερε τεράστιο πλήγμα στο ChatGPT την περασμένη εβδομάδα όταν ενσωμάτωσε τον Bard σε διάφορες εφαρμογές. Το Gmail, το YouTube, οι Χάρτες Google και οι Πτήσεις είναι μερικές μόνο από τις εφαρμογές που λαμβάνουν υποστήριξη για το Bard. Αυτό είναι ένα

πλεονέκτημα σε σχέση με το ChatGPT, αλλά το OpenAI δεν μένει με σταυρωμένα τα χέρια. Πριν από λίγες μέρες, το OpenAI κυκλοφόρησε μια νέα έκδοση Dall-E που σας επιτρέπει να χρησιμοποιείτε το ChatGPT για τη δημιουργία εικόνων AI. Και τώρα, το OpenAI ανακοίνωσε ότι η δωρεάν έκδοση του ChatGPT θα λειτουργήσει με φωνητικές προτροπές και εικόνες στο πολύ εγγύς μέλλον.

Δηλαδή, μπορείτε να μιλήσετε με το ChatGPT αντί να χρειάζεται να πληκτρολογήσετε σε iPhone και Android. Επίσης, θα μπορείτε να χρησιμοποιείτε εικόνες για να λαμβάνετε καλύτερες απαντήσεις. Το καλύτερο μέρος αυτών των ενημερώσεων είναι ότι δεν θα χρειαστεί να πληρώσετε για το ChatGPT Plus για να τις λάβετε. Ωστόσο, οι συνδρομητές που πληρώνουν θα είναι οι πρώτοι που θα τα δοκιμάσουν.

Το OpenAI ανακοίνωσε την ικανότητα του ChatGPT να ακούει και να μιλάει

μια ανάρτηση ιστολογίου

την Δευτέρα. Οι λειτουργίες θα είναι αρχικά διαθέσιμες στους χρήστες Plus και Enterprise, οι οποίοι θα τις αποκτήσουν τις επόμενες δύο εβδομάδες. Στη συνέχεια, “άλλες ομάδες χρηστών, συμπεριλαμβανομένων των προγραμματιστών”, θα τις λάβουν σύντομα μετά από αυτό. Αυτό σημαίνει ότι η δωρεάν εμπειρία ChatGPT θα υποστηρίζει επίσης φωνητικές εντολές και εντολές εικόνας.

Χρήση εικόνων σε προτροπές ChatGPT

Εάν η χρήση εικόνων στο ChatGPT ακούγεται οικείο, αυτό οφείλεται στο γεγονός ότι το είχαμε μιλήσει πριν. Έτσι λειτουργούν τα πολυτροπικά μοντέλα παραγωγής τεχνητής νοημοσύνης. Είναι παρόμοιο με το πώς η Google χρησιμοποιεί το Google Lens με AI. Όσον αφορά τις εντολές εικόνας ChatGPT, το OpenAI λέει ότι η κατανόηση εικόνας τροφοδοτείται από πολυτροπικά GPT-3.5 και GPT-4.

Το παρακάτω παράδειγμα

δείχνει έναν ιδιοκτήτη ποδηλάτου να ανεβάζει μια φωτογραφία του ποδηλάτου του και να κάνει μια ερώτηση. Το ChatGPT παρέχει μια απάντηση, με τον χρήστη στη συνέχεια να ανεβάζει επιπλέον εικόνες, ώστε το chatbot να κατανοήσει καλύτερα το πρόβλημα.

Ο χρήστης σχεδιάζει ακόμη και έναν κύκλο γύρω από το στοιχείο του ποδηλάτου που αντιπροσωπεύει το κύριο θέμα συζήτησης, ώστε το ChatGPT να μπορεί να προσαρμόσει την απόκριση. Επιπλέον, ο χρήστης ανεβάζει εικόνες που δείχνουν τα εργαλεία που έχει στη διάθεσή του, ώστε το bot να μπορεί να του πει ποιο να χρησιμοποιήσει για να κατεβάσει το κάθισμα.

Αυτή είναι μια εξαιρετική λειτουργικότητα για προσθήκη στο ChatGPT, μια που θα λειτουργήσει εκπληκτικά σε smartphone. Και το OpenAI παρουσιάζει το παράδειγμα εισαγωγής εικόνας για την έκδοση του ChatGPT για φορητές συσκευές. Ωστόσο, θα υπάρχουν ορισμένοι περιορισμοί στα πράγματα που μπορεί να πει το ChatGPT για τους ανθρώπους που εμφανίζονται στις εικόνες:


με επίσης τεχνικά μέτρα για να περιορίσουμε σημαντικά την ικανότητα του ChatGPT να αναλύει και να κάνει άμεσες δηλώσεις για άτομα, καθώς το ChatGPT

πάντα ακριβές και αυτά τα συστήματα θα πρέπει να σέβονται το απόρρητο των ατόμων.

Τα μηνύματα προτροπής εικόνας θα είναι επίσης διαθέσιμα σε υπολογιστές, αλλά θα είναι πολύ πιο εύκολο να χρησιμοποιήσετε ένα smartphone για να τραβήξετε πρόσθετες φωτογραφίες σχετικές με μια συγκεκριμένη συνομιλία με το ChatGPT.

Υποστήριξη φωνής για iPhone και Android

Η λειτουργία φωνητικής υποστήριξης έρχεται μόνο στις εφαρμογές ChatGPT για iPhone και Android. Και είναι κάτι που σίγουρα χρειάζεται για τέτοιου είδους εφαρμογές. Το να μιλάς με τις εφαρμογές AI του τηλεφώνου μέσω φωνής αντί να πληκτρολογείς τα πάντα είναι πολύ πιο εύκολο. Θα πρέπει απλώς να ενεργοποιήσετε τη λειτουργία στην ενότητα Ρυθμίσεις της εφαρμογής μόλις είναι διαθέσιμη σε iPhone και Android.

Ίσως θελήσετε να ελέγξετε πώς γίνεται ο χειρισμός των φωνητικών δεδομένων από την άποψη του απορρήτου. Το OpenAI δεν εξετάζει αυτήν την πτυχή στην ανακοίνωση. Επομένως, υποθέτω ότι η τρέχουσα πολιτική απορρήτου ισχύει για όλες τις συνομιλίες με το ChatGPT. ότι οι προτροπές σας θα σας βοηθήσουν να εκπαιδεύσετε τον φωνητικό βοηθό εκτός και αν εξαιρεθείτε. Ωστόσο, η πολιτική απορρήτου ενδέχεται να ενημερωθεί μόλις αρχίσει να κυκλοφορεί αυτή η δυνατότητα.

Το OpenAI πρόσφερε τη συνομιλία ChatGPT παρακάτω, λέγοντας μια ιστορία πριν τον ύπνο, ως παράδειγμα του τι μπορεί να κάνει η φωνή σε ένα πρόγραμμα παραγωγής τεχνητής νοημοσύνης.

Το OpenAI λέει ότι χρειάζεται μόνο μερικά δευτερόλεπτα δείγματος ομιλίας για να δημιουργήσει ήχο που μοιάζει με άνθρωπο από κείμενο. Χρησιμοποιεί ένα νέο μοντέλο μετατροπής κειμένου σε ομιλία για αυτό. Όμως, για να αποφευχθεί η κατάχρηση, το OpenAI βασίζεται σε φωνητικούς ηθοποιούς για τη φωνή του ChatGPT:

Η νέα τεχνολογία φωνής — ικανή να δημιουργεί ρεαλιστικές συνθετικές φωνές από λίγα μόνο δευτερόλεπτα πραγματικής ομιλίας — ανοίγει πόρτες σε πολλές δημιουργικές και εστιασμένες στην προσβασιμότητα εφαρμογές. Ωστόσο, αυτές οι δυνατότητες παρουσιάζουν επίσης νέους κινδύνους, όπως η πιθανότητα κακόβουλων παραγόντων να υποδύονται δημόσια πρόσωπα ή να διαπράττουν απάτη.

Είναι ενδιαφέρον ότι το OpenAI λέει επίσης ότι συνεργάζεται με το Spotify για να δοκιμάσει μια νέα λειτουργία Voice Translation για

που επιτρέπει στους δημιουργούς να μεταφράζουν το περιεχόμενό τους σε άλλες γλώσσες χρησιμοποιώντας τη δική τους φωνή.



bgr.com


Leave A Reply



Cancel Reply

Your email address will not be published.