חוקרי מיקרוסופט מדווחים על כך יצרו טכנולוגיה חדשה לזיהוי דיבור המתעתקת דיבור מדבר, בדיוק כמו שאדם עושה. שיעור השגיאות של המערכת למילה מדווח על 5,9 אחוזים., שזה בערך זהה למתמללים מקצועיים שהתבקשו לעבוד על אותן הקלטות, על פי מיקרוסופט.
"הגענו לשוויון עם האדם", אמר המדען שואדונג הואנג, שהביא את המידע העיקרי בהצהרה, המכנה אבן דרך זו 'הישג היסטורי'.
כדי להגיע לאבן הדרך, הצוות השתמש ברשת מחשבים ובערכת כלים של מיקרוסופט, כמו גם מערכת למידה עמוקה ביתית שצוות המחקר העמיד לרשותך ב- GitHub באמצעות רישיון קוד פתוח. המערכת משתמשת בטכנולוגיית רשת עצבית בקבוצות של מילים דומות, המאפשר למודלים לעבוד ביעילות מילה במילה.
רשתות עצביות מבוססות על כמויות גדולות של נתונים הנקראות "נתוני אימון". והם הוקמו כדי ללמד תעתיקי מחשבים לזהות תבניות תחביריות בצלילים. מיקרוסופט מתכננת להשתמש בטכנולוגיה בקורטנה, העוזרת הקולית האישית שלך ב- Windows ו- Xbox One, כמו גם תוכנת תמלול דיבור לטקסט.
אבל לטכנולוגיה יש עוד דרך ארוכה לעבור לפני שהוא יכול לעבד את המשמעות העיקרית (הסמנטיקה) ואת הידע ההקשר, מאפיינים מרכזיים בשימוש בשפה היומיומית שצריכים להילקח על ידי עוזרים אישיים, כמו סירי, כדי לעבד בקשות ולפעול לפיהן בצורה מועילה.
"אנו מתרחקים מעולם שבו אנשים צריכים להבין את מחשבי העולם בעוד מחשבים עדיין לא מבינים אותנו", אמר הארי שום, העומד בראש קבוצת המחקר של מיקרוסופט. עם זאת, יעבור זמן רב עד שמחשבים יוכלו להבין את המשמעות האמיתית של הנאמר, הזהיר. "בינה מלאכותית אמיתית עדיין נמצאת באופק רחוק".
אני חושב שזה צעד אדיר, היום בו נוכל לקיים אינטראקציה עם מכשירים ללא שימוש בציוד היקפי ישנה לחלוטין את דרך הבנת הקשר בין האדם למכונות.