Το ChatGPT κυκλοφορεί νέες δυνατότητες φωνής και εικόνας για το chatbot στις εφαρμογές του για κινητά
Το OpenAI προσθέτει ακόμη περισσότερες δυνατότητες στο chatbot ChatGPT. Σήμερα, η εταιρεία ανακοίνωσε ότι έχει αρχίσει να κυκλοφορεί νέες λειτουργίες φωνής στις εφαρμογές της για κινητά, μαζί με τρόπους αποστολής εικόνων που μπορούν να αναλυθούν από το ChatGPT.
Σε μια ανάρτηση στο blog
, το OpenAI ανακοίνωσε ότι οι χρήστες του ChatGPT θα μπορούν σύντομα να μιλούν στο chatbot. Μόλις η λειτουργία είναι διαθέσιμη στην εφαρμογή iOS και Android, οι χρήστες μπορούν να μεταβούν στο μενού Ρυθμίσεις και, στη συνέχεια, να πατήσουν στην επιλογή Νέες δυνατότητες. Στη συνέχεια, μπορούν να πατήσουν για να συμμετέχουν στις φωνητικές συνομιλίες της εφαρμογής. Τέλος, μπορούν να πατήσουν στο εικονίδιο των ακουστικών και να επιλέξουν μία από τις πέντε επιλογές φωνής.
Το OpenAI δήλωσε:
Η νέα δυνατότητα φωνής τροφοδοτείται από ένα νέο μοντέλο μετατροπής κειμένου σε ομιλία, ικανό να παράγει ήχο που μοιάζει με άνθρωπο μόνο από κείμενο και μερικά δευτερόλεπτα δείγματος ομιλίας. Συνεργαστήκαμε με επαγγελματίες φωνητικούς ηθοποιούς για να δημιουργήσουμε κάθε μία από τις φωνές. Χρησιμοποιούμε επίσης το Whisper, το ανοιχτού κώδικα σύστημα αναγνώρισης ομιλίας μας, για να μεταγράψουμε τις προφορικές σας λέξεις σε κείμενο.
Οι εφαρμογές ChatGPT για κινητά θα μπορούν σύντομα να χρησιμοποιούν το κουμπί φωτογραφίας είτε για να τραβήξουν μια φωτογραφία είτε να επιλέξουν μια ήδη δημιουργημένη. Το ChatGPT μπορεί στη συνέχεια να ελέγξει τη φωτογραφία και να εκτελέσει μια σειρά από διαφορετικές εργασίες, όπως η ανάλυση ενός γραφήματος για εργασία, η αντιμετώπιση προβλημάτων όταν μια συσκευή δεν λειτουργεί και πολλά άλλα.
Το OpenAI δήλωσε:
Η κατανόηση εικόνας τροφοδοτείται από πολυτροπικά GPT-3.5 και GPT-4. Αυτά τα μοντέλα εφαρμόζουν τις γλωσσικές τους συλλογιστικές δεξιότητες σε ένα ευρύ φάσμα εικόνων, όπως φωτογραφίες, στιγμιότυπα οθόνης και έγγραφα που περιέχουν κείμενο και εικόνες.
Οι νέες δυνατότητες θα κυκλοφορήσουν τις επόμενες δύο εβδομάδες και θα είναι διαθέσιμες πρώτα για τους χρήστες ChatGPT Plus και Enterprise. Αυτές οι δυνατότητες θα επεκταθούν σε προγραμματιστές και άλλους χρήστες ChatGPT στο εγγύς μέλλον.
Την περασμένη εβδομάδα, το OpenAI ανακοίνωσε το DALL-E 3, την επόμενη έκδοση της συσκευής δημιουργίας εικόνων AI που θα προσφέρει ενοποίηση με το ChatGPT. Θα κυκλοφορήσει επίσημα τον Οκτώβριο.

