Microsoftovi istraživači to izvještavaju stvorili su novu tehnologiju prepoznavanja govora koja transkribira kolokvijalni govor, baš kao što to čini ljudsko biće. Izvještava se da je stopa pogrešaka sustava po riječi 5,9 posto., što je otprilike isto što i profesionalni transkripcionisti od kojih se tražilo da rade na istim snimkama, navodi Microsoft.
"Postigli smo paritet s ljudskim", rekao je znanstvenik Xuedong Huang, koji je dao glavne informacije u izjavi, nazvavši ovu prekretnicu "povijesnim postignućem".
Da bi postigli prekretnicu, tim je koristio računalnu mrežu i Microsoftov alat, kao i domaći sustav za duboko učenje koji je istraživački tim stavio na raspolaganje na GitHub-u putem licence otvorenog koda. Sustav koristi tehnologiju neuronske mreže na skupinama sličnih riječi, omogućavajući modelima učinkovit rad od riječi do riječi.
Neuronske mreže temelje se na velikim količinama podataka koje se nazivaju "podaci o treningu". i osnovani su da podučavaju prepisivanje računala da prepoznaju sintaktičke obrasce u zvukovima. Microsoft planira koristiti tehnologiju u Cortani, vaš osobni glasovni asistent na sustavima Windows i Xbox One, kao i softver za prepisivanje govora u tekst.
Pero tehnologija mora još dugo prijeći Prije nego što može obraditi glavno značenje (semantiku) i kontekstualno znanje, ključne karakteristike u svakodnevnoj upotrebi jezika koje osobni asistenti, poput Sirija, trebaju shvatiti kako bi obrađivali zahtjeve i na njih korisno djelovali.
"Udaljavamo se od svijeta u kojem ljudi moraju razumjeti svjetska računala, dok nas računala još uvijek ne razumiju", rekao je Harry Shum, koji je na čelu Microsoftove istraživačke skupine za inteligenciju. Međutim, proći će puno vremena dok računala ne shvate pravo značenje onoga što se govori, upozorio je. "Prava umjetna inteligencija još je uvijek na dalekom horizontu".
Mislim da je to strašan korak, dan kad možemo komunicirati s uređajima bez upotrebe perifernih uređaja, potpuno će promijeniti način razumijevanja odnosa čovjeka i strojeva.