Οι ερευνητές της Microsoft το αναφέρουν έχουν δημιουργήσει μια νέα τεχνολογία αναγνώρισης ομιλίας που μεταγράφει την ομιλία, όπως κάνει ο άνθρωπος. Το ποσοστό σφάλματος του συστήματος ανά λέξη αναφέρεται ότι είναι 5,9 τοις εκατό., που είναι περίπου το ίδιο με τους επαγγελματίες μεταγραφείς που τους ζητήθηκε να εργαστούν στις ίδιες ηχογραφήσεις, σύμφωνα με τη Microsoft.
"Έχουμε φτάσει σε ισοτιμία με τον άνθρωπο", δήλωσε ο επιστήμονας Xuedong Huang, ο οποίος έδωσε τις βασικές πληροφορίες σε μια δήλωση, αποκαλώντας αυτό το ορόσημο «ιστορικό επίτευγμα».
Για να φτάσετε στο ορόσημο, η ομάδα χρησιμοποίησε ένα δίκτυο υπολογιστών και μια εργαλειοθήκη Microsoft, καθώς και ένα οικιακό σύστημα βαθιάς μάθησης που η ερευνητική ομάδα διέθεσε στο GitHub μέσω άδειας ανοιχτού κώδικα Το σύστημα χρησιμοποιεί τεχνολογία νευρικού δικτύου σε ομάδες παρόμοιων λέξεων, επιτρέποντας στα μοντέλα να λειτουργούν αποτελεσματικά λέξη προς λέξη.
Τα νευρικά δίκτυα βασίζονται σε μεγάλες ποσότητες δεδομένων που ονομάζονται "δεδομένα εκπαίδευσης". και είναι εγκατεστημένοι για να διδάσκουν μεταγράφουν υπολογιστές να αναγνωρίζουν συντακτικά μοτίβα στους ήχους. Η Microsoft σχεδιάζει να χρησιμοποιήσει την τεχνολογία στην Cortana, ο προσωπικός σας βοηθός φωνής σε Windows και Xbox One, καθώς και λογισμικό μεταγραφής ομιλίας σε κείμενο.
Αλλά η τεχνολογία έχει ακόμη πολύ δρόμο να διανύσει Πριν μπορέσει να επεξεργαστεί το κύριο νόημα (τη σημασιολογία) και τις γνώσεις με βάση τα συμφραζόμενα, βασικά χαρακτηριστικά στη χρήση της καθημερινής γλώσσας που πρέπει να κατανοηθούν από προσωπικούς βοηθούς, όπως το Siri, για την επεξεργασία των αιτημάτων και τη δράση τους με έναν χρήσιμο τρόπο.
"Απομακρυνόμαστε από έναν κόσμο όπου οι άνθρωποι πρέπει να καταλάβουν τους υπολογιστές του κόσμου, ενώ οι υπολογιστές εξακολουθούν να μην μας καταλαβαίνουν", δήλωσε ο Χάρι Σουμ, επικεφαλής της ερευνητικής ομάδας AI της Microsoft. Ωστόσο, θα περάσει πολύς καιρός προτού οι υπολογιστές καταλάβουν την πραγματική σημασία του τι λέγεται, προειδοποίησε. "Η αληθινή τεχνητή νοημοσύνη βρίσκεται ακόμα σε μακρινό ορίζοντα".
Νομίζω ότι είναι ένα τεράστιο βήμα, την ημέρα που μπορούμε να αλληλεπιδράσουμε με συσκευές χωρίς τη χρήση περιφερειακών θα αλλάξει εντελώς τον τρόπο κατανόησης της σχέσης του ανθρώπου με τις μηχανές.