นักวิจัยของ Microsoft รายงานว่า ได้สร้างเทคโนโลยีการรู้จำเสียงแบบใหม่ที่ถอดเสียงพูดเป็นคำพูดเช่นเดียวกับมนุษย์ อัตราข้อผิดพลาดของระบบต่อคำรายงานเป็น 5,9 เปอร์เซ็นต์ซึ่งใกล้เคียงกับนักถอดเสียงมืออาชีพที่ถูกขอให้ทำงานกับการบันทึกเดียวกันตามที่ Microsoft กล่าว
"เราได้บรรลุความเท่าเทียมกับมนุษย์แล้ว" Xuedong Huang นักวิทยาศาสตร์กล่าวซึ่งให้ข้อมูลหลักในแถลงการณ์ เรียกเหตุการณ์สำคัญนี้ว่า 'ความสำเร็จครั้งประวัติศาสตร์'
เพื่อบรรลุเป้าหมาย ทีมงานใช้เครือข่ายคอมพิวเตอร์และชุดเครื่องมือของ Microsoftตลอดจนระบบการเรียนรู้เชิงลึกที่ทีมวิจัยจัดเตรียมไว้ให้ใน GitHub ผ่านใบอนุญาตโอเพนซอร์ส ระบบใช้เทคโนโลยีเครือข่ายประสาทเทียมกับกลุ่มคำที่คล้ายกันช่วยให้โมเดลทำงานได้อย่างมีประสิทธิภาพ
โครงข่ายประสาทเทียมขึ้นอยู่กับข้อมูลจำนวนมากที่เรียกว่า "ข้อมูลการฝึกอบรม" และจัดตั้งขึ้นเพื่อสอนการถอดเสียงคอมพิวเตอร์ให้จดจำรูปแบบวากยสัมพันธ์ในเสียง Microsoft วางแผนที่จะใช้เทคโนโลยีนี้ใน Cortanaผู้ช่วยเสียงส่วนตัวของคุณบน Windows และ Xbox One ตลอดจนซอฟต์แวร์การถอดเสียงพูดเป็นข้อความ
ลูกแพร์ เทคโนโลยียังมีหนทางอีกยาวไกล ก่อนที่จะประมวลผลความหมายหลัก (ความหมาย) และความรู้ตามบริบทลักษณะสำคัญในการใช้ภาษาในชีวิตประจำวันที่ผู้ช่วยส่วนตัวต้องเข้าใจเช่น Siri เพื่อประมวลผลคำขอและดำเนินการกับสิ่งเหล่านี้อย่างเป็นประโยชน์
“ เรากำลังก้าวออกไปจากโลกที่ผู้คนต้องเข้าใจคอมพิวเตอร์ของโลกในขณะที่คอมพิวเตอร์ยังไม่เข้าใจเรา” Harry Shum หัวหน้ากลุ่มวิจัย AI ของ Microsoft กล่าว อย่างไรก็ตามจะต้องใช้เวลานานก่อนที่คอมพิวเตอร์จะเข้าใจความหมายที่แท้จริงของสิ่งที่กำลังพูดเขาเตือน "ปัญญาประดิษฐ์ที่แท้จริงยังอยู่ไกลสุดขอบฟ้า".
ฉันคิดว่ามันเป็นขั้นตอนที่ยิ่งใหญ่วันที่เราสามารถโต้ตอบกับอุปกรณ์ได้โดยไม่ต้องใช้อุปกรณ์ต่อพ่วงจะเปลี่ยนวิธีการทำความเข้าใจความสัมพันธ์ของมนุษย์กับเครื่องจักรโดยสิ้นเชิง