Els investigadors de Microsoft informen que han creat una nova tecnologia de reconeixement de veu que transcriu la parla col·loquial, Així com ho fa un ésser humà. La taxa d'error per paraula d'sistema informen que és d'un 5,9 per cent, El que és aproximadament igual als transcriptors professionals als quals se'ls va demanar treballar en la mateixes enregistraments, d'acord amb Microsoft.
«Hem arribat a la paritat amb l'humà», va dir el científic Xuedong Huang, qui va donar la informació principal en un comunicat, cridant a aquesta fita com un «èxit històric».
Per assolir la fita, l'equip va utilitzar una xarxa computacional i un kit d'eines de Microsoft, Com també un sistema de collita pròpia per a l'aprenentatge profund que l'equip d'investigació va deixar disponible a GitHub a través d'una llicència de codi obert. El sistema utilitza una tecnologia de xarxes neuronals sobre grups de paraules similars, El que permet als models el treballar eficientment paraula per paraula.
Les xarxes neuronals es basen en grans quantitats de dades anomenats «dades de formació» i s'estableixen per ensenyar als ordinadors que transcriuen a reconèixer patrons sintàctics en els sons. Microsoft planeja utilitzar la tecnologia en Cortana, El seu assistent personal de veu en Windows i Xbox Un, així com en programari de transcripció de veu a text.
Però la tecnologia encara té un llarg camí per recórrer abans que pugui processar el significat principal (la semàntica) i el coneixement contextual, característiques claus en l'ús de l'llenguatge quotidià que necessita ser captat per assistents personals, com Siri, per processar les sol·licituds i actuar-hi d'una manera útil.
«Ens estem allunyant d'un món on la gent ha d'entendre als ordinadors de el món mentre que els ordinadors encara no ens entenen a nosaltres», va dir Harry Shum, que dirigeix el grup de recerca d'AI de Microsoft. No obstant això, passarà molt de temps abans de que els ordinadors puguin entendre el veritable significat del que es diu, ha advertit. «La veritable intel·ligència artificial encara està en un horitzó llunyà».
Jo crec que és un pas terrible, el dia que puguem interactuar amb els dispositius sense utilitzar perifèrics canviés totalment la forma d'entendre la relació de l'home amb les màquines.