Αναμέτρηση της εφαρμογής εγγραφής φωνής Samsung Galaxy S24 εναντίον Google Pixel — ποιος έχει τις καλύτερες δυνατότητες AI;
Η εφαρμογή Recorder στα τηλέφωνα Pixel της
Google
είναι εύκολα ένα από τα αγαπημένα μου πράγματα για χρήση σε αυτές τις συσκευές. Ήταν μια από τις πρώτες ενσωματωμένες εφαρμογές εγγραφής
που
μπορούσαν να μεταγράψουν εγγραφές σε πραγματικό χρόνο και προστίθενται συνεχώς έξυπνες λειτουργίες, όπως η δυνατότητα αναγνώρισης διαφορετικών ηχείων. Εάν βρίσκεστε στη δουλειά μου και πρέπει να ηχογραφήσετε και να μεταγράψετε συνεντεύξεις, η χρήση της εφαρμογής Recorder έχει αποδειχθεί ότι εξοικονομεί χρόνο. Και φαντάζομαι φοιτητές που παρακολουθούν πολλές διαλέξεις, υπάλληλοι γραφείου που κάθονται σε συσκέψεις και οποιοσδήποτε έχει τάση για ηχογράφηση φωνητικών σημειώσεων θα μπορούσε να πει το ίδιο.
Μόνο τώρα η εφαρμογή Recorder της Google έχει εταιρεία. Ως μέρος της κυκλοφορίας του Galaxy S24, η Samsung δημιούργησε τη δική της εφαρμογή εγγραφής φωνής με μια σειρά από λειτουργίες που υποστηρίζονται από AI που θα ακούγονται οικεία σε όποιον έχει αφιερώσει χρόνο στην εφαρμογή Recorder σε οποιοδήποτε πρόσφατο τηλέφωνο Pixel. Το Voice Recorder της Samsung μπορεί επίσης να μετατρέψει αρχεία ήχου σε μεταγραφές κειμένου, ακόμη και να μεταφράσει το κείμενο σε μία από τις 13 γλώσσες, αν το επιθυμείτε. Αναγνωρίζει αυτόματα πότε μιλούν διαφορετικοί άνθρωποι, και μπορεί να χρησιμοποιήσει την τεχνητή νοημοσύνη για να παρέχει γρήγορες περιλήψεις του τι υπάρχει σε μια εγγραφή. (Αυτή η τελευταία δυνατότητα είναι διαθέσιμη στην εφαρμογή Recorder της Google, αλλά μόνο εάν χρησιμοποιείτε ένα ενημερωμένο Pixel 8 Pro.)
Τώρα
που οι εφαρμογές εγγραφής φωνής και στα δύο τηλέφωνα Android βρίσκονται σε λίγο πολύ ίσες βάσεις, εγείρει μια ενδιαφέρουσα ερώτηση για τους ανθρώπους που χρησιμοποιούν συχνά αυτήν τη δυνατότητα — ποια εφαρμόζει τις λειτουργίες AI με καλύτερο τρόπο; Και υπάρχει αρκετή διαφορά για να κάνετε είτε ένα Pixel 8 είτε ένα Galaxy S24 την καλύτερη επιλογή όταν σκέφτεστε ένα νέο τηλέφωνο;
Για να το μάθω, αποφάσισα να εκτελέσω τις αντίστοιχες εφαρμογές εγγραφής από τη Samsung και την Google μέσω μιας σειράς δοκιμών. Πήρα το πιο πρόσφατο ναυαρχίδα της Samsung που χρησιμοποίησα για την κριτική μου για το Galaxy S24 και το έβαλα με ένα Pixel 7a, καθώς αυτό είναι το πιο πρόσφατο τηλέφωνο Google που έχω στη διάθεσή μου. Το Pixel 7a μπορεί να μην έχει το πιο πρόσφατο chipset Tensor G3 που τροφοδοτεί τα μοντέλα Pixel 8 και να μην υποστηρίζει περιλήψεις εγγραφής, αλλά κατά τα άλλα, διαθέτει τις ίδιες δυνατότητες που προσφέρει το Voice Recorder στο Galaxy S24.
Δείτε πώς η εφαρμογή εγγραφής μου με τεχνητή νοημοσύνη κατέρρευσε.
Δοκιμή πρώτης εφαρμογής εγγραφής φωνής Samsung Galaxy S24 έναντι Pixel 7a — ατομική εγγραφή
Μεταγραφή Galaxy S24 (αριστερά) και μεταγραφή Pixel 7a (δεξιά)
(Εικόνα: Μέλλον)
Για να δοκιμάσω τις βασικές λειτουργίες μεταγραφής κάθε εφαρμογής ηχογράφησης, έβγαλα το σκοτεινό μου αντίγραφο της ανθολογίας της αμερικανικής λογοτεχνίας Norton και ηχογράφησα τον εαυτό μου ταυτόχρονα στο Galaxy S24 και στο Pixel 7a καθώς διάβαζα δυνατά το “The Raven” του Edgar Allan Poe. Ανακάλυψα δύο πράγματα — 1) αυτό είναι το ποίημα
πολύ
περισσότερο από όσο ίσως θυμάστε. και 2) και οι δύο εφαρμογές εγγραφής παρουσίασαν αρκετά λάθη στις μεταγραφές τους.
Στην πραγματικότητα, περνώντας τις τέσσερις πρώτες στροφές του “The Raven” – επαναλαμβάνω: είναι ένα πολύ
μεγάλο
ποίημα – μέτρησα επτά λάθη το καθένα στις μεταγραφές του Galaxy S24 και του Pixel 7a, αν και κάθε εφαρμογή εγγραφής ενεργοποιήθηκε με διαφορετικούς τρόπους. Για παράδειγμα, όταν είπα “ανώνυμος εδώ για πάντα περισσότερο”, το Galaxy S24 άκουγε “άσκοπο”, ενώ το Pixel 7a μετέτρεψε “κάθε ξεχωριστή χόβολη που πεθαίνει στο πάτωμα” σε “κάθε ξεχωριστός αριθμός που πεθαίνει σαπίζει το φάντασμα του στο πάτωμα”. ”
Μου φάνηκε ιδιαίτερα εντυπωσιακό το πώς και οι δύο εφαρμογές εγγραφής θα άκουγαν λάθος την ίδια φράση με διαφορετικούς τρόπους. Για παράδειγμα, η “ωχρή προτομή του Παλλάς” – ομολογουμένως, δεν είναι μια φράση που ακούγεται πολύ στη συζήτηση – έγινε “ο ουρανίσκος προτομή ενός παλατιού” στη μεταγραφή του Pixel 7a, ενώ το Galaxy S24 το μετέτρεψε σε “χλωμό λεωφορείο για να μας σφυροκοπήσει, «που ακούγεται πολύ πιο τρελό από αυτό που είχε στο μυαλό του ο Πόε.
Αν θέλετε να εντοπίσετε μια διαφορά στον τρόπο με τον οποίο αυτές οι δύο εφαρμογές εγγραφής προσέγγισαν τη μεταγραφή της ανάγνωσης του “The Raven”, το Pixel 7a έδειξε ότι ένα δεύτερο ηχείο ήταν παρόν τέσσερις φορές – πιθανότατα όταν σταμάτησα για δραματικό εφέ. Εάν αυτό ακούγεται ανακριβές, η μεταγραφή εγγραφής του Galaxy S24 περιελάμβανε 15 περιπτώσεις ενός δεύτερου ηχείου που εμφανίστηκε στη μέση της απαγγελίας.
Δοκιμή δύο — δύο ηχείων της εφαρμογής εγγραφής φωνής Samsung Galaxy S24 έναντι Pixel 7a
Μεταγραφή Galaxy S24 (αριστερά) και μεταγραφή Pixel 7a (δεξιά)
(Εικόνα: Μέλλον)
Πώς αποδίδουν λοιπόν οι αντίστοιχες εφαρμογές εγγραφής όταν υπάρχουν πραγματικά
είναι
πολλά άτομα μιλούν σε μια ηχογράφηση; Για να το μάθουμε, η γυναίκα μου και εγώ διαβάσαμε τον διάλογο από τη σκηνή διαπραγμάτευσης συμβολαίων μεταξύ του Γκρούτσο και του Τσίκο Μαρξ στο «Μια νύχτα στην Όπερα».
Με ενδιαφέρουν λιγότερο οι ακριβείς μεταγραφές σε αυτό το τεστ και με ενδιαφέρουν περισσότερο ποια εφαρμογή εγγραφής φωνής μπόρεσε να αναγνωρίσει σωστά πότε μιλούσε το σωστό άτομο. Χρησιμοποιώντας αυτή τη μέτρηση, η συσκευή εγγραφής φωνής του Galaxy S24 έρχεται στην κορυφή.
Μέτρησα 12 περιπτώσεις όπου η τεχνητή νοημοσύνη του Galaxy S24 εντόπισε εσφαλμένα ποιος ήταν ο ηχείο. Αν αυτό δεν ακούγεται ιδιαίτερα καλό για ένα κλιπ 4,5 λεπτών, είναι ακόμα καλύτερο από τις 16 φορές που η εφαρμογή Recorder του Pixel 7a ανέφερε λάθος ηχείο. Σημειώστε ότι μετράω μόνο τις φορές που η μεταγραφή πέρασε εντελώς από έναν νέο ομιλητή και όχι περιπτώσεις όπου η πρώτη λέξη μιας πρότασης αποδόθηκε σε λάθος ομιλητή. Σε αυτές τις τελευταίες περιπτώσεις, το ποσοστό σφάλματος του Pixel 7a θα ήταν πολύ υψηλότερο.
Αλλαγή ετικέτας ηχείου στο Galaxy S24 (αριστερά) και στο Pixel 7a (δεξιά)
(Εικόνα: Μέλλον)
Η εφαρμογή Pixel Recorder διευκολύνει πολύ την αντιστοίχιση λέξεων που δεν έχουν αποδοθεί σωστά στο σωστό ηχείο. Απλώς πατήστε τη μεταγραφή και εμφανίζεται μια επιλογή Split From Here. Αφού χωρίσετε το διάλογο, μπορείτε να πατήσετε το όνομα του ηχείου για να λάβετε ένα γρήγορο μενού για την εναλλαγή των ετικετών των ηχείων προς τα επάνω. Σχεδόν όπως μπορώ να πω, δεν υπάρχει παρόμοια ενέργεια στην εφαρμογή Samsung.
Τουλάχιστον η αντιστοίχιση διαφορετικών ονομάτων στα ηχεία είναι αρκετά εύκολη και στις δύο εφαρμογές. Το ίδιο γρήγορο μενού που εμφανίζεται στο Recorder της Google έχει επίσης μια εντολή Μετονομασία ηχείου που κάνει μια καθολική αναζήτηση και αντικατάσταση σε όλη τη μεταγραφή. Στο Samsung Voice Recorder, επιλέγετε πρώτα Επεξεργασία από το μενού επιλογών και πατάτε στο όνομα του ηχείου. μπορείτε να μετονομάσετε το ηχείο μόνο στο επιλεγμένο μπλοκ κειμένου ή σε ολόκληρη τη μεταγραφή.
Δοκιμή τρίτης εφαρμογής εγγραφής φωνής Samsung Galaxy S24 έναντι Pixel 7a — εγγραφή από τον υπολογιστή σας
Μεταγραφή Galaxy S24 (αριστερά) και μεταγραφή Pixel 7a (δεξιά)
(Εικόνα: Μέλλον)
Εάν η αναγνώριση διαφορετικών ηχείων στο ίδιο δωμάτιο είναι δύσκολη για συσκευές εγγραφής φωνής με τεχνητή νοημοσύνη, θα φανταζόσασταν ότι είναι ακόμη πιο δύσκολο όταν ηχογραφείτε από τον υπολογιστή σας. Εξάλλου, τουλάχιστον οι φωνές από τα ηχεία στην ίδια αίθουσα προέρχονται από διαφορετικές τοποθεσίες, γεγονός που θα διευκολύνει την αναγνώριση του πότε κάποιος διαφορετικός έχει τον λόγο. σε έναν υπολογιστή, όλες οι φωνές προέρχονται από το ίδιο μέρος.
Και όμως, σε αυτήν την εποχή των συναντήσεων Zoom και των διαδικτυακών εργαλείων εκπαίδευσης, μπορεί να βρεθείτε να ηχογραφείτε ήχο από υπολογιστή στον οποίο μιλούν πολλά άτομα. Επομένως, οι εφαρμογές Google Recorder ή Samsung Voice Recorder έχουν κάποιο πλεονέκτημα έναντι των άλλων σε αυτήν την περίπτωση; Για να το μάθω, έκανα ουρά σε μια έκδοση ροής του “The Odd Couple” για να δω ποια εφαρμογή θα μπορούσε να κάνει τη διαφορά μεταξύ του Felix Unger και του Oscar Madison.
Παρά το γεγονός ότι υπάρχουν μόνο δύο άτομα σε αυτή τη σκηνή, το Galaxy S24 εντόπισε επτά διαφορετικά ηχεία. Και αυτό που άκουγε από αυτούς μεταγραφόταν συχνά λανθασμένα — ο θρήνος του Όσκαρ ότι «έμενα μόνος σε αυτό το διαμέρισμα» έγινε κατά κάποιο τρόπο «Έζησα μόνος στο Chipotle».
Η εφαρμογή Recorder στο Pixel 7a απαριθμούσε τρία διαφορετικά ηχεία, κάτι που είναι ελαφρώς καλύτερο, αν και μεγάλα
κομμάτια
της συνομιλίας μεταξύ του Oscar και του Felix ομαδοποιήθηκαν κάτω από μια ενιαία ετικέτα ηχείων. Τουλάχιστον, η μεταγραφή στο Pixel 7a ήταν αισθητά πιο καθαρή από την προσπάθεια του S24.
Εφαρμογή εγγραφής φωνής Samsung Galaxy S24 εναντίον Pixel 7a: Περιλήψεις
(Εικόνα: Μέλλον)
Όπως σημειώθηκε στην αρχή, η εφαρμογή εγγραφής φωνής Galaxy S24 περιλαμβάνει μια λειτουργία σύνοψης στην οποία ένα εργαλείο με τεχνητή νοημοσύνη εξετάζει την εγγραφή και εμφανίζει μερικά γρήγορα σημεία που υπογραμμίζουν την ουσία των όσων λέγονται. Η Google πρόσθεσε παρόμοια δυνατότητα στο Recorder της μέσω ενημέρωσης λογισμικού, αλλά μόνο για το Pixel 8 Pro, σύμφωνα με
έγγραφο βοήθειας σχετικά με τη χρήση της δυνατότητας
. Και δεν είμαι σίγουρος ότι κάθε Pixel 8 Pro έχει λάβει την ενημερωμένη έκδοση, καθώς ο συνάδελφός μου John Velasco δεν μπόρεσε να τη βρει στο Pixel 8 Pro του όταν ζήτησα βοήθεια με την καταγραφή face-off.
Ακόμα κι αν μπορούσαμε να συγκρίνουμε εργαλεία σύνοψης, θα εξακολουθούσα να πιστεύω ότι η εφαρμογή της Samsung έχει το προβάδισμα εδώ. Για αρχή, είναι μια δυνατότητα διαθέσιμη σε κάθε μοντέλο S24, από την αρχική συσκευή μέχρι το Galaxy S24 Ultra. Όχι μόνο τα παλαιότερα Pixel που τροφοδοτούνται με Tensor δεν μπορούν να χρησιμοποιήσουν τη λειτουργία σύνοψης, αλλά προφανώς δεν είναι καν διαθέσιμη στο τυπικό Pixel 8.
Βοηθά επίσης ότι το εργαλείο σύνοψης στο Galaxy S24 είναι αρκετά ακριβές. Έλαβε την ουσία αυτού για το οποίο μάλωναν ο Όσκαρ και ο Φέλιξ, αν και λανθασμένα νόμιζε ότι ο Όσκαρ ήταν αυτός που μετακόμισε με τον Φέλιξ και όχι το αντίστροφο. Η τεχνητή νοημοσύνη του S24 συνόψισε επίσης τα σημαντικότερα σημεία του “The Raven” – “Ο αφηγητής συλλογίζεται παλιά βιβλία όταν ακούει ένα χτύπημα στην πόρτα” και “Ο αφηγητής συναντά ένα μυστηριώδες πουλί που λέει τις λέξεις “Ποτέ άλλο”. χρονοσήμανση.
Εφαρμογή εγγραφής φωνής Samsung Galaxy S24 εναντίον Pixel 7a: Άλλες παρατηρήσεις
(Εικόνα: Μέλλον)
Παρατήρησα μερικά άλλα πράγματα κατά τη δοκιμή των εφαρμογών εγγραφής στα τηλέφωνα Galaxy S24 και Pixel που αξίζει να αναφέρουμε, ακόμα κι αν δεν μπορούν πραγματικά να αξιολογήσουν τις αντίστοιχες δυνατότητές τους.
- Οι μεταγραφές γίνονται διαθέσιμες στην εφαρμογή Pixel Recorder μέσα σε λίγα δευτερόλεπτα από την έναρξη της εγγραφής, ώστε να μπορείτε να παρακολουθήσετε το κείμενο της εγγραφής σας να εμφανίζεται στην οθόνη σε πραγματικό χρόνο, αν προτιμάτε. Στο Galaxy S24, η μεταγραφή πραγματοποιείται μόνο αφού διακόψετε και αποθηκεύσετε την εγγραφή.
- Το Pixel 7a μου μπορεί να δημιουργήσει αυτόματα ονόματα για ηχογραφήσεις με βάση αυτό που πιστεύει ότι είναι τα θέματα — η ανάγνωση του “The Raven” είχε τον κατάλληλο τίτλο “Raven” ενώ αυτό το κλιπ “Odd Couple” αποθηκεύτηκε ανεξήγητα ως “Japan”. Μπορείτε πάντα να εισάγετε το δικό σας όνομα ή να αλλάξετε το όνομα που δημιουργείται αυτόματα, αν θέλετε. Στη συσκευή εγγραφής φωνής του Galaxy S24, παρέχετε τα δικά σας ονόματα αρχείων.
- Από ό,τι αξίζει, βρίσκω τα εργαλεία επεξεργασίας στην εφαρμογή Recorder του Pixel 7a λίγο πιο εύκολα στην πλοήγηση από αυτά της εφαρμογής Galaxy S24, αλλά αυτό θα μπορούσε να οφείλεται στο γεγονός ότι έχω χρησιμοποιήσει το Recorder σε πολλές εκδόσεις του Pixel.
Εφαρμογή εγγραφής φωνής Samsung Galaxy S24 εναντίον Pixel 7a: Ετυμηγορία
Οι δυνατότητες τεχνητής νοημοσύνης στις εφαρμογές εγγραφής της Google και στις εφαρμογές εγγραφής φωνής της Samsung αποδεικνύονται σύνθετες – σε ορισμένες ηχογραφήσεις, η έκδοση της Google αποδεικνύεται πιο ακριβής, ενώ σε άλλες, το Galaxy S24 παράγει καλύτερη μεταγραφή. Επειδή είναι πιο εύκολο να διορθώσετε εσφαλμένα ηχεία και να επεξεργαστείτε μεταγραφές στα τηλέφωνα Pixel, αυτή θα εξακολουθεί να είναι η εφαρμογή εγγραφής της επιλογής μου, ακόμα κι αν το Pixel δεν είναι πάντα σε θέση να αναγνωρίσει με ακρίβεια το σωστό ηχείο. Νομίζω όμως ότι η ευρύτερη υποστήριξη της Samsung για την εγγραφή περιλήψεων είναι αξιέπαινη.
Ωστόσο, τόσο η Google όσο και η Samsung θα μπορούσαν να αντέχουν να δώσουν στις δυνατότητες AI των εφαρμογών εγγραφής τους λίγο βερνίκι για να κάνουν τις μεταγραφές λίγο πιο καθαρές και λιγότερο εξαρτημένες από την ανθρώπινη παρέμβαση για τη διόρθωση λέξεων που ακούγονται λάθος. Δεν νομίζω ότι καμία από τις δύο εφαρμογές είναι τόσο προηγμένη σε αυτό το σημείο που σημαίνει ότι θα πρέπει να αγοράσετε ένα Pixel 8 έναντι ενός Galaxy S24 (ή το αντίστροφο) για την ενίσχυση αυτών των δυνατοτήτων τεχνητής νοημοσύνης και μόνο. Αλλά με ενδιαφέρει να δω πώς εξελίχθηκαν τα χαρακτηριστικά με τα μελλοντικά τηλέφωνα, ιδιαίτερα με τη Samsung που μόλις ξεκινάει με το Galaxy AI.
Περισσότερα από το Tom’s Guide
VIA:
TomsGuide.com