Microsoft và "thành tựu bước ngoặt" trong công nghệ nhận dạng giọng nói

microsoft

Các nhà nghiên cứu của Microsoft báo cáo rằng đã tạo ra một công nghệ nhận dạng giọng nói mới để phiên âm lời nói thông tục, giống như một con người. Tỷ lệ lỗi của hệ thống trên mỗi từ được báo cáo là 5,9 phần trăm., điều này gần giống với những nhân viên ghi chép chuyên nghiệp được yêu cầu làm việc trên cùng một bản ghi âm, theo Microsoft.

Nhà khoa học Xuedong Huang, người đưa ra thông tin chính trong một tuyên bố cho biết: “Chúng tôi đã đạt đến mức ngang bằng với con người. gọi cột mốc này là một 'thành tựu lịch sử'.

Để đạt được cột mốc quan trọng, nhóm đã sử dụng mạng máy tính và bộ công cụ của Microsoft, cũng như hệ thống học sâu cây nhà lá vườn mà nhóm nghiên cứu đã cung cấp trên GitHub thông qua giấy phép nguồn mở. Hệ thống sử dụng công nghệ mạng nơ-ron trên các nhóm từ giống nhau, cho phép các mô hình hoạt động hiệu quả từng từ một.

Mạng nơ-ron dựa trên một lượng lớn dữ liệu được gọi là "dữ liệu huấn luyện". và chúng được thành lập để dạy máy tính phiên âm nhận dạng các mẫu cú pháp trong âm thanh. Microsoft có kế hoạch sử dụng công nghệ này trong Cortana, trợ lý giọng nói cá nhân của bạn trên Windows và Xbox One, cũng như phần mềm chuyển lời nói thành văn bản.

Nhưng công nghệ vẫn còn một chặng đường dài phía trước Trước khi nó có thể xử lý ý nghĩa chính (ngữ nghĩa) và kiến ​​thức ngữ cảnh, các đặc điểm chính trong việc sử dụng ngôn ngữ hàng ngày cần được các trợ lý cá nhân, chẳng hạn như Siri, nắm bắt để xử lý các yêu cầu và hành động theo cách hữu ích.

Harry Shum, người đứng đầu nhóm nghiên cứu AI của Microsoft cho biết: “Chúng ta đang rời xa một thế giới mà mọi người phải hiểu máy tính của thế giới trong khi máy tính vẫn không hiểu chúng ta”. Tuy nhiên, sẽ còn lâu nữa máy tính mới có thể hiểu được ý nghĩa thực sự của những gì đang được nói, ông cảnh báo. "Trí tuệ nhân tạo thực sự vẫn còn ở một chân trời xa".


Theo dõi chúng tôi trên Google Tin tức

Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: AB Internet Networks 2008 SL
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.

  1.   CARLOS dijo

    Tôi nghĩ đó là một bước tiến to lớn, ngày mà chúng ta có thể tương tác với các thiết bị mà không cần sử dụng thiết bị ngoại vi sẽ thay đổi hoàn toàn cách hiểu về mối quan hệ của con người với máy móc.