Το ChatGPT μπορεί τώρα να δει, να ακούσει και να μιλήσει
Σε μερικούς μήνες, το chatbot ChatGPT του OpenAI λαμβάνει διάφορες νέες αναβαθμίσεις και βελτιώσεις σε τακτική βάση. Πρόσφατα, το OpenAI ανακοίνωσε μια σειρά από νέες δυνατότητες, κάνοντας το ChatGPT πιο έξυπνο. Σύμφωνα με την επίσημη ανάρτηση Blog, το OpenAi ανακοίνωσε ότι η εταιρεία αρχίζει να διαθέτει νέες δυνατότητες και βελτιωμένες δυνατότητες στο ChatGPT.
Το OpenAI έκανε μια επίσημη ανακοίνωση σχετικά με τη διαδικασία κυκλοφορίας των νέων δυνατοτήτων φωνής και εικόνας στο chatbot του, ChatGPT. Αυτές οι πιο πρόσφατες λειτουργίες θα προσφέρουν έναν νέο, πιο καινοτόμο τύπο διεπαφής χρήστη, επιτρέποντας στους χρήστες να έχουν μια φωνητική συνομιλία ή να δείχνουν στο chatbot τι μιλούν οι χρήστες.
Η νέα δυνατότητα φωνής και εικόνας του ChatGPT προσφέρει έναν πιο διαδραστικό τρόπο χρήσης του chatbot στην καθημερινή ζωή. Για παράδειγμα, όταν τραβάτε μια φωτογραφία μιας συγκεκριμένης τοποθεσίας ενώ ταξιδεύετε, μπορείτε να συνομιλήσετε σχετικά με όλες τις ενδιαφέρουσες πληροφορίες σχετικά με αυτήν. Εν τω μεταξύ, το OpenAI κυκλοφορεί το Voice και τις εικόνες στο ChatGPT στο Plus καθώς και στους χρήστες Enterprise τις επόμενες δύο εβδομάδες. Παράλληλα, το Voice κυκλοφορεί σε συσκευές iOS και Android, ενώ οι εικόνες θα είναι διαθέσιμες σε όλες τις πλατφόρμες.
Το ChatGpt είναι εκεί για να σας μιλήσει
.
Οι χρήστες πρέπει απλώς να ενεργοποιήσουν το ChatGPT μαζί με τις φωνητικές προτροπές και μπορούν να συμμετέχουν σε συνομιλίες ένας προς έναν με τον βοηθό. Η νέα λειτουργία φωνής είναι γεμάτη με την πιο πρόσφατη λειτουργία μετατροπής κειμένου σε ομιλία, η οποία είναι εξαιρετικά ικανή να παράγει ήχο που μοιάζει με άνθρωπο μόνο από κείμενο και μερικά δευτερόλεπτα επίδειξης ομιλίας χρησιμοποιώντας τη δυνατότητα Whisper, η οποία είναι το σύστημα αναγνώρισης ανοιχτού κώδικα του OpenAI που μεταγράφει τις προφορικές σας λέξεις σε κείμενα.
Δείξτε μια εικόνα στο ChatGPT και αφήστε το να απαντήσει
.
Με αυτήν την τελευταία ενημέρωση, οι χρήστες μπορούν πλέον να εμφανίζουν στο ChatGPT μία ή περισσότερες από μία εικόνες και να αφήνουν το ChatGPT να απαντήσει στις πληροφορίες σχετικά με την εικόνα. Για να εστιάσετε σε ένα συγκεκριμένο μέρος ενός αντικειμένου, μπορείτε να χρησιμοποιήσετε το εργαλείο σχεδίασης στην εφαρμογή για κινητά. Το ChatGPT χρησιμοποιεί το πολυτροπικό
GPT-3.5
και
GPT-4
για την κατανόηση της εικόνας, εφαρμόζοντας επίσης τις συγκεκριμένες γλωσσικές τους συλλογιστικές δεξιότητες σε μια μεγάλη ποικιλία εικόνων, συμπεριλαμβανομένων των φωτογραφιών, των στιγμιότυπων οθόνης και άλλων εγγράφων που περιέχουν κείμενο και εικόνες.
Επιπλέον, το OpenAI έχει δεσμευτεί ότι θα αυξήσει σταδιακά τη διαθεσιμότητα των εργαλείων φωνής και εικόνας και θα επεκτείνει τις νέες δυνατότητες φωνής και εικόνας για τους χρήστες Plus και Enterprise, συμπεριλαμβανομένων των προγραμματιστών, ώστε να μπορούν να βιώσουν τη νέα βελτιωμένη διεπαφή πολύ σύντομα. τις επόμενες δύο εβδομάδες.
Σχετίζεται με

