Τι είναι το Google Cloud AutoML Vision;
Η Google άρχισε πρόσφατα να προσφέρει μια μεγάλη σειρά εργαλείων τεχνητής νοημοσύνης σε καθημερινές επιχειρήσεις και φιλόδοξα προϊόντα λογισμικού που χρησιμοποιούν πλατφόρμες Google, ίσως από ένα ικανό Chromebook. Ένα ενδιαφέρον παράδειγμα τα τελευταία χρόνια είναι το AutoML Vision του
Google Cloud
. Αυτό το εργαλείο για τη δημιουργία μοντέλων ανάλυσης εικόνας ενδέχεται να κλείσει σύντομα για την κυκλοφορία του Vertex AI. Ωστόσο, μπορείτε να μάθετε πώς λειτουργεί και πώς να προετοιμάζετε δεδομένα, τα οποία θα είναι ανεκτίμητα κατά τη χρήση παρόμοιων μελλοντικών υπηρεσιών της Google. Ας δούμε τις λεπτομέρειες.
Τι είναι το AutoML Vision του Google Cloud;
Το AutoML Vision είναι διαθέσιμο μέσω του Google Cloud. Σας επιτρέπει να εκπαιδεύσετε μοντέλα μηχανικής
μάθηση
ς για την ταξινόμηση εικόνων και την αναγνώριση αντικειμένων σε αυτές τις εικόνες. Αποτελεί μέρος της ευρύτερης πλατφόρμας Cloud Vision για
προγραμματιστές
λογισμικού. Περιλαμβάνει κιτ για την ανάπτυξη εφαρμογών για κινητά και παρέχει λύσεις εικόνας AI σε χρησιμοποιήσιμες μορφές για εσωτερικές ομάδες ή καταναλωτές.
Το Cloud Vision έχει να κάνει με την αξιοποίηση της τεχνητής νοημοσύνης (AI) για την ανάλυση πολλών εικόνων ταυτόχρονα για την αναγνώριση σημαντικών πραγμάτων όπως ανθρώπινα πρόσωπα, είδη ζώων, κτίρια ή αυτοκίνητα κ.λπ. Η υπηρεσία περιλαμβάνει γενική ανάλυση εικόνας AI από μόνη της. Το AutoML Vision επιτρέπει στους χρήστες να δημιουργούν πιο συγκεκριμένα μοντέλα AI για στοχευμένες εργασίες που μπορούν να εμφανιστούν σε ορισμένους κλάδους. Στο παρελθόν, η εκπαίδευση μοντέλων τεχνητής νοημοσύνης όπως αυτό θα απαιτούσε πολύ κουραστική ανθρώπινη εργασία στην οποία ελάχιστοι οργανισμοί μπορούν να έχουν πρόσβαση. Η λύση της Google αυτοματοποιεί τη διαδικασία επισήμανσης για να εξοικονομήσει απίστευτο χρόνο.
Τελευταίο αλλά εξίσου σημαντικό, το AutoML Vision δεν είναι πολύ καιρό για αυτόν τον κόσμο. Ο χρόνος του λήγει στις αρχές του 2024, οπότε οι χρήστες θα πρέπει να αρχίσουν να χρησιμοποιούν τη νεότερη, συγχωνευμένη υπηρεσία τεχνητής νοημοσύνης που ονομάζεται Vertex AI.
Το AutoML Vision είναι μόνο για επιχειρήσεις;
Είναι μόνο για μεγαλύτερα έργα τεχνητής νοημοσύνης που βασίζονται σε εικόνες που συνήθως χρειάζονται εταιρείες σε επίπεδο επιχειρήσεων ή φιλόδοξες νεοφυείς επιχειρήσεις. Απαιτεί έναν τόνο αποθηκευτικού χώρου στο cloud και επιχειρηματικά σχέδια υψηλού επιπέδου της Google, μεταξύ άλλων.
Ποια έργα μπορούν να επιχειρήσουν οι επιχειρήσεις με το AutoML Vision;
Το AutoMl Vision επιτρέπει στις επιχειρήσεις να κατασκευάζουν μοντέλα εικόνων AI μέσω του Google Cloud, ώστε να μην χρειάζονται όλο το υλικό στον χώρο για να χρησιμοποιήσουν πολύπλοκη, ενεργοβόρα τεχνητή νοημοσύνη. Αλλά ποιος χρειάζεται να αναλύσει τεράστιες παρτίδες εικόνων όπως αυτή έξω από γεννήτριες εικόνων όπως το Midjourney; Υπάρχουν
αρκετές εξειδικευμένες περιπτώσεις
όπου οι εταιρείες μπορεί να θέλουν μια πιο στοχευμένη λύση, όπως:
- Ανάλυση μεγάλου καταλόγου προϊόντων και αυτόματη επισήμανση εικόνων: Η Urban Outfitters το κάνει αυτό για να αναγνωρίσει τύπους και στυλ ρούχων στον κατάλογο προϊόντων της, κάτι πέρα από τη γενικότερη τεχνητή νοημοσύνη.
- Παρακολούθηση και αναγνώριση άγριας ζωής από μια σειρά από κάμερες: Ομάδες διατήρησης, όπως η Ζωολογική Εταιρεία του Λονδίνου, διαθέτουν μοντέλα εκπαίδευσης για την παρακολούθηση ειδών άγριας ζωής σε μια ευρεία περιοχή.
- Ανάλυση κάμερας ασφαλείας για έλεγχο συμβάντων ασφαλείας και δραστών. Οι εταιρείες ασφαλείας μεγάλης κλίμακας ενδιαφέρονται για αυτού του είδους τις λύσεις λογισμικού.
- Εταιρείες όπως η Kewpie εκπαιδεύουν την τεχνητή νοημοσύνη να παρακολουθεί τα συστατικά στις εγκαταστάσεις παραγωγής τους για να παρακολουθούν την ποιότητα και τη συνέπεια καθώς οι προμήθειες περνούν από τις κάμερες. Άλλοι κατασκευαστές χρησιμοποιούν παρόμοια τεχνολογία για να παρακολουθούν για ελαττώματα στα εργοστάσιά τους.
Επιπλέον
, δεδομένου ότι οι οργανισμοί αξιοποιούν τις δυνατότητες αναγνώρισης εικόνων της Google (καλά, τουλάχιστον μερικές από αυτές), δεν χρειάζεται να δημιουργήσουν ή να νοικιάσουν ακριβό AI αλλού.
Πώς θα προετοίμαζε η ομάδα μου περιεχόμενο για το AutoML Vision;
Στο AutoML Vision, πρέπει να προετοιμάσετε προσεκτικά τα δεδομένα πριν χρησιμοποιήσετε τις υπηρεσίες εκπαίδευσης. Μικρά σφάλματα σε αυτό το στάδιο μπορεί να καταστρέψουν την έξοδο, η οποία αποτελεί σημαντικό μέρος της διαδικασίας. Είναι επίσης βαθιά ενσωματωμένο στα εργαλεία της Google, επομένως η ομάδα σας πρέπει να αισθάνεται άνετα με την κοινή σουίτα Google και τα εργαλεία έργου GCP (Google Cloud Platform).
Όταν είναι έτοιμη, μια ομάδα δημιουργεί ένα συγκεκριμένο έργο GCP για την εκπαίδευση ενός
μοντέλο
υ και στη συνέχεια συλλέγει όλες τις εικόνες που χρησιμοποιούνται για εκπαίδευση σε μία παρτίδα. Οι εικόνες θα πρέπει ιδανικά να είναι υψηλής ποιότητας και να περιλαμβάνουν κάποια ακραία σημεία και «λάθη» για ευκολότερη εκπαίδευση και οι εταιρείες θα θέλουν πολλά από αυτά. Η ιδανική προπόνηση χρησιμοποιεί δεκάδες χιλιάδες εικόνες. Η Zoological Society of London που αναφέραμε παραπάνω αναλύει εκατομμύρια εικόνες άγριας ζωής. Εάν δεν έχετε τουλάχιστον μερικές χιλιάδες εικόνες, αυτή η εκπαίδευση μπορεί να μην είναι η καλύτερη λύση (παρά το τεχνικό ελάχιστο των 100 εικόνων).
Οι ομάδες θα δημιουργήσουν αρχεία CSV για να επισημαίνουν αντικείμενα και να υποδεικνύουν τις λίγο πολύ ακριβείς συντεταγμένες αυτών των αντικειμένων σε μια εικόνα. Αυτό είναι σχετικά εύκολο να συνδυαστεί με αρκετή εκπαίδευση και οι υπηρεσίες AutoML της Google έχουν σχεδιαστεί για να αναλύουν αρχεία CSV εφόσον περιλαμβάνονται στις εικόνες. Αφού τα δεδομένα επισήμανσης και οι εικόνες παρέχονται στο AutoML Vision μέσω του cloud, οι ομάδες καθορίζουν τη διάρκεια εκπαίδευσης για την εκπαίδευση ενός μοντέλου AI.
Επιπλέον, οι ομάδες μπορούν να σχεδιάσουν με μη αυτόματο τρόπο εικόνες με ένα εργαλείο σχολιασμού της Google για να δείξουν τι θέλουν να αναγνωριστούν, γεγονός που μπορεί να εξοικονομήσει χρόνο σε ορισμένες περιπτώσεις.
Μπορώ να εξάγω τα μοντέλα μου AutoML Vision;
Αυτά τα μοντέλα AI έχουν σχεδιαστεί για εξαγωγή σε πολλές διαφορετικές συνθήκες, ειδικά μέσω της αρχιτεκτονικής της Google όπως το Tensorflow Lite και το CoreML της Apple.
Πότε κλείνει το AutoML Vision και τι θα χρησιμοποιήσω στη συνέχεια;
Το όραμα AutoML είναι επί του παρόντος καταργημένο και, από αυτήν τη στιγμή, θα κλείσει στις 23 Ιανουαρίου 2024. Αυτό δεν αφήνει χρόνο για μετεγκατάσταση εάν οι εταιρείες δεν έχουν ξεκινήσει. Εάν είστε νέοι στην εκπαίδευση AI, ξεκινήστε με τον διάδοχο:
Το Vertex AI της Google
. Αυτή η πιο ολοκληρωμένη σουίτα καλύπτει βασικά όλες τις υπηρεσίες κτιρίου B2B AI της Google.
Οι εταιρείες που εργάζονται στο AutoML Vision θα βρουν τα εργαλεία AutoML της Vertex AI παρόμοια με αυτά που χρησιμοποιούνται, επομένως δεν απαιτείται μεγάλη επανεκπαίδευση. Ωστόσο, οι εταιρείες πρέπει να μεταφέρουν δεδομένα στο Vertex AI και να παρακολουθούν για σημαντικές διαφορές κατά τη διαδικασία μορφοποίησης. Ορισμένες τιμές μεταξύ Vision και Vertex είναι διαφορετικές. Τα μοντέλα τεχνητής νοημοσύνης χαμηλού επιπέδου, συγκεκριμένα, θα είναι πιο ακριβά ή δεν θα είναι διαθέσιμα. Η μετεγκατάσταση είναι δωρεάν, αλλά εάν δημιουργηθούν νέοι πόροι ή απαιτηθεί νέος χώρος αποθήκευσης, θα μπορούσαν να προστεθούν επιπλέον χρεώσεις με τα νέα σχέδια τιμολόγησης.
Τι κοστίζει το AutoML Vision;
Δεν πειράζει. Εάν ξεκινάτε ένα νέο έργο, θα θέλετε να χρησιμοποιήσετε τη νέα σουίτα Vertex AI. Ας υποθέσουμε ότι εξακολουθείτε να εργάζεστε με εικόνες.
Στο Vertex AI
, οι χρεώσεις εξαρτώνται από το τι κάνετε με διάφορες εικόνες. Αλλά επειδή εστιάζουμε στις τιμές AutoML AI, ας αναλύσουμε το κόστος των υπηρεσιών AutoML επί του παρόντος στο Vertex.
-
Εκπαίδευση για κατάταξη
: 3,465 $ ανά ώρα -
Εκπαίδευση για ανίχνευση αντικειμένων
: 3,465 $ ανά ώρα -
Εκπαίδευση με μοντέλο Edge On-Device
: 18 $ την ώρα -
Υπηρεσίες ανάπτυξης και πρόβλεψης
: 1.375 $ – 2.002 $ ανά ώρα -
Πρόβλεψη παρτίδας
: 2,222 $ ανά ώρα
Οι προηγμένες υπηρεσίες, όπως τα ειδικά εκπαιδευμένα μοντέλα για συγκεκριμένα θέματα, απαιτούν εξειδικευμένη εργασία και πιο εξατομικευμένες τιμές.
Θα αναλάβουν το Cloud Vision και το AutoM Vision (ή το Vertex AI) τη δουλειά της ανάλυσης μου;
Είναι μια κοινή ερώτηση και δύσκολο να προβλεφθεί. Η Google θα ήθελε πολύ οι υπηρεσίες τεχνητής νοημοσύνης της να εμπλέκονται σε όλα, καταγράφοντας κάθε κομμάτι περιεχομένου για ανάλυση. Αυτό δεν είναι ακριβώς εφικτό αυτή τη στιγμή, αλλά οι εταιρείες σε όλο τον κόσμο εξακολουθούν να εργάζονται για να κατανοήσουν τι μπορούν να κάνουν για αυτές οι προσαρμοσμένες υπηρεσίες οπτικής τεχνητής νοημοσύνης. Οι ισχυρισμοί ποικίλλουν από “Η τεχνητή νοημοσύνη θα κάνει τα πάντα για εμάς” έως “Η τεχνητή νοημοσύνη μπορεί να έχει κάποιες εξειδικευμένες λύσεις για εμάς, αλλά όχι σε αυτές τις τιμές”.
Αυτό που είδαμε είναι προσαρμοσμένα μοντέλα τεχνητής νοημοσύνης σε αυτήν την κατεύθυνση που αναλαμβάνουν κουραστικές δουλειές στις οποίες οι άνθρωποι δεν είναι καλοί. Η παρακολούθηση προϊόντων σε μια γραμμή συναρμολόγησης για ορατά ελαττώματα είναι ένα καλό παράδειγμα. Δεν είναι πολλοί πλέον άνθρωποι που κάνουν τέτοιες δουλειές. Άλλες εργασίες που θα μπορούσαν να δουν επανάσταση περιλαμβάνουν την παρακολούθηση της ασφάλειας και την εργασία QA σε πολλές βιομηχανίες.
Έχετε υπόψη σας τον διάδοχο του AutoML Vision για μεγαλύτερα έργα ανάλυσης AI
Οι εταιρείες έχουν μόνο λίγους μήνες για να εργαστούν με το AutoML Vision. Εάν δεν έχετε ξεκινήσει τη μετεγκατάσταση δεδομένων στο Vertex AI, δεν έχετε πολύ χρόνο. Για τους νεοφερμένους, η Vertex AI παρέχει παρόμοιες υπηρεσίες σε ένα ευρύτερο πακέτο.
Καθώς περισσότερες εταιρείες εξετάζουν πώς η τεχνητή νοημοσύνη θα μπορούσε να βοηθήσει τις διαδικασίες τους, η Google είναι κάτι παραπάνω από έτοιμη να παρέχει έτοιμες λύσεις που εξοικονομούν χρόνο. Το κόστος (πέρα από το κυριολεκτικό κόστος) μένει εξ ολοκλήρου στην πλατφόρμα της Google έως ότου το μοντέλο AI είναι έτοιμο για εξαγωγή. Για να μάθετε περισσότερα, ρίξτε μια ματιά στα πιο πρόσφατα σχετικά με το έργο Gemini της Google και πώς η Google χρησιμοποιεί την τεχνητή νοημοσύνη για το Google Recorder.
