Το ChatGPT σάς επιτρέπει τώρα να μιλήσετε μαζί του ή να υποβάλετε φωτογραφίες για μηνύματα
Calvin Wankhede / Android Authority
TL;DR
- Το OpenAI κυκλοφορεί νέες δυνατότητες για το ChatGPT.
- Οι χρήστες θα μπορούν πλέον να ζητούν από το chatbot με τη φωνή τους ή μια εικόνα.
- Οι λειτουργίες θα είναι αρχικά διαθέσιμες μόνο σε χρήστες που πληρώνουν για ChatGPT.
Από το ντεμπούτο του, το OpenAI ενημερώνει συνεχώς το chatbot του — ChatGPT — με νέες δυνατότητες. Η τελευταία ενημέρωση θα φέρει δύο νέους τρόπους για να ειδοποιήσετε το ChatGPT: μέσω φωνής ή μέσω εικόνας.
Σήμερα, OpenAI
ανακοινώθηκε
μερικές νέες δυνατότητες έρχονται στο ChatGPT τις επόμενες δύο εβδομάδες. Ένα από τα νέα χαρακτηριστικά θα επιτρέπει στους χρήστες να υποβάλλουν μηνύματα με τη φωνή τους και να έχουν το bot AI να μιλάει.
Αντί να πληκτρολογήσετε κάτι στο πεδίο, θα μπορείτε να πατήσετε ένα κουμπί και να κάνετε την ερώτησή σας προφορικά. Στη συνέχεια, το ChatGPT θα μετατρέψει αυτό που λέτε μετατρέποντάς το σε κείμενο και τροφοδοτώντας αυτό το κείμενο στο μοντέλο της μεγάλης γλώσσας (LLM). Όταν απαντήσει, θα μετατρέψει την απάντηση που βασίζεται σε κείμενο σε ομιλία που μπορείτε να ακούσετε. Δεν είναι τόσο διαφορετικό από το πώς θα χρησιμοποιούσατε έναν εικονικό βοηθό όπως το
Google Assistant
ή την Alexa.
Χρησιμοποιήστε τη φωνή σας για να συμμετάσχετε σε μια συνεχή συνομιλία με το ChatGPT. Μιλήστε μαζί του εν κινήσει, ζητήστε μια
ιστορία
πριν τον ύπνο ή διευθετήστε μια συζήτηση στο τραπέζι του δείπνου.
Το OpenAI διαθέτει ήδη ένα σύστημα αναγνώρισης ομιλίας για ομιλία σε κείμενο που ονομάζεται Whisper. Αλλά η εταιρεία κυκλοφορεί τώρα ένα νέο μοντέλο που είναι «ικανό να δημιουργεί ρεαλιστικές συνθετικές φωνές από λίγα μόνο δευτερόλεπτα πραγματικής ομιλίας».
Η εταιρεία βλέπει δυνατότητες σε αυτήν την τεχνολογία πέρα από τις φωνητικές προτροπές, καθώς επισημαίνει ότι συνεργάζεται με το Spotify για την πιλοτική λειτουργία της δυνατότητας Voice Translation. Όπως εξηγεί το OpenAI, αυτό θα επέτρεπε τη μετάφραση των podcast σε άλλες γλώσσες με τη φωνή του podcastor.
Υπάρχει ένας εγγενής κίνδυνος για μια τέτοια τεχνολογία, όπως ένας κακόβουλος παράγοντας που χρησιμοποιεί την τεχνολογία για να υποδυθεί άλλους και να διαπράξει απάτη. Στο blog του OpenAI, η εταιρεία αναγνωρίζει τον κίνδυνο και ισχυρίζεται ότι η τεχνολογία θα χρησιμοποιηθεί μόνο για συγκεκριμένες περιπτώσεις χρήσης και συνεργασίες.
Η υποκείμενη έρευνα – δημιουργία φωνής και κατανόηση εικόνας – προσφέρει μια ματιά στο τι θα είναι ικανό στο μέλλον η πολύ πιο προηγμένη τεχνητή νοημοσύνη. Μάθετε περισσότερα σχετικά με αυτήν την ενημέρωση και τα μέτρα ασφαλείας μας:
https://t.co/uNZjgbR5Bm
Η άλλη νέα δυνατότητα είναι κάτι που δόθηκε στο chatbot
Bard
της Google πριν από μήνες — προτροπές εικόνας. Όπως και με τη χρήση του Google Lens, το οποίο τροφοδοτεί τις δυνατότητες προτροπής εικόνων του Bard, θα μπορείτε να υποβάλετε μια φωτογραφία και το ChatGPT θα προσπαθήσει να καταλάβει τι ζητάτε. Εάν θέλετε να διευκρινίσετε τι ψάχνετε, η εφαρμογή διαθέτει ένα εργαλείο σχεδίασης για να σας βοηθήσει να εντοπίσετε κάτι συγκεκριμένο. Θα έχετε επίσης την επιλογή να μιλήσετε ή να πληκτρολογήσετε ερωτήσεις που να συνοδεύουν την εικόνα.
Όπως και το άλλο χαρακτηριστικό, αυτή η δυνατότητα συνοδεύεται από κινδύνους. Για παράδειγμα, δεν θα θέλατε κάποιος να έχει τη δυνατότητα να εισάγει μια φωτογραφία σας και να του δώσει το chatbot λεπτομέρειες για εσάς. Για αυτό η εταιρεία αναφέρει:
Λάβα
με επίσης τεχνικά μέτρα για να περιορίσουμε σημαντικά την ικανότητα του ChatGPT να αναλύει και να κάνει άμεσες δηλώσεις σχετικά με άτομα, καθώς το ChatGPT
δεν είναι
πάντα ακριβές και αυτά τα συστήματα θα πρέπει να σέβονται το απόρρητο των ατόμων.
Ενώ αυτές οι δυνατότητες θα κάνουν το ChatGPT πολύ πιο λειτουργικό και πιο εύκολο στη χρήση, υπάρχουν σαφή μειονεκτήματα στην τεχνολογία. Η εταιρεία έχει εφαρμόσει προστατευτικά κιγκλιδώματα, αλλά είναι άγνωστο αν θα είναι αρκετά για να αποτρέψει κακούς ηθοποιούς από την κατάχρηση αυτών των εργαλείων.

