Microsoftovi istraživači to izvještavaju stvorili su novu tehnologiju prepoznavanja govora koja transkribira kolokvijalni govor, baš kao što to čini ljudsko biće. Izvještava se da stopa sistemskih grešaka po riječi iznosi 5,9 posto., što je otprilike isto kao profesionalni transkripcionisti od kojih se tražilo da rade na istim snimkama, navodi Microsoft.
"Postigli smo paritet s ljudskim," rekao je naučnik Xuedong Huang, koji je dao glavne informacije u izjavi, nazvavši ovu prekretnicu „istorijskim dostignućem“.
Da bi postigli prekretnicu, tim je koristio računarsku mrežu i Microsoftov alat, kao i domaći sistem dubokog učenja koji je istraživački tim stavio na raspolaganje na GitHub-u putem licence otvorenog koda. Sistem koristi tehnologiju neuronske mreže na grupama sličnih riječi, omogućavajući modelima efikasan rad od riječi do riječi.
Neuronske mreže temelje se na velikim količinama podataka koje se nazivaju "podaci o treningu". i osnovani su da podučavaju računare koji prepisuju prepoznavanje sintaksičkih obrazaca u zvukovima. Microsoft planira da koristi tehnologiju u Cortani, vaš lični glasovni asistent na Windowsima i Xbox One, kao i softver za transkripciju govora u tekst.
Ali tehnologija mora još dugo prijeći Prije nego što može obraditi glavno značenje (semantiku) i kontekstualno znanje, ključne karakteristike u svakodnevnoj upotrebi jezika koje trebaju shvatiti osobni asistenti, kao što je Siri, kako bi obrađivali zahtjeve i na njih korisno djelovali.
"Udaljavamo se od svijeta u kojem ljudi moraju razumjeti svjetske računare, dok nas računari još uvijek ne razumiju", rekao je Harry Shum, koji je na čelu Microsoftove istraživačke grupe za inteligenciju. Međutim, proći će puno vremena dok računari ne shvate pravo značenje onoga što se govori, upozorio je. "Prava umjetna inteligencija još uvijek je na dalekom horizontu".
Mislim da je to izuzetan korak, dan kada možemo komunicirati s uređajima bez upotrebe perifernih uređaja, potpuno će promijeniti način razumijevanja odnosa čovjeka i mašina.