マイクロソフトの研究者は、 口語音声を転写する新しい音声認識技術を作成しました、人間と同じように。 単語あたりのシステムのエラー率は5,9%であると報告されています。マイクロソフトによると、これは同じ録音に取り組むように依頼されたプロの転写士とほぼ同じです。
「私たちは人間と同等に達しました」と声明の中で主要な情報を与えた科学者XuedongHuangは言いました、 このマイルストーンを「歴史的成果」と呼んでいます。
マイルストーンに到達するには、 チームはコンピューターネットワークとMicrosoftツールキットを使用しました、および研究チームがオープンソースライセンスを通じてGitHubで利用できるようにした自家製のディープラーニングシステム。 システムは、類似した単語のグループにニューラルネットワークテクノロジーを使用します、モデルが単語ごとに効率的に機能できるようにします。
ニューラルネットワークは、「トレーニングデータ」と呼ばれる大量のデータに基づいています。 そしてそれらは、音の構文パターンを認識するように転写コンピュータを教えるために設立されました。 Microsoftは、Cortanaでこのテクノロジを使用することを計画しています、WindowsおよびXbox Oneの個人用音声アシスタント、および音声文字変換ソフトウェア。
しかし テクノロジーにはまだ長い道のりがあります 主な意味(セマンティクス)とコンテキスト知識を処理する前に、Siriなどのパーソナルアシスタントが要求を処理して有用な方法で処理するために把握する必要のある日常の言語使用の主要な特性。
マイクロソフトのAI研究グループの責任者であるハリーシャムは、次のように述べています。 しかし、コンピューターが言われていることの本当の意味を理解できるようになるまでには長い時間がかかるだろうと彼は警告した。 「真の人工知能はまだ遠い地平線にあります」.
周辺機器を使わずにデバイスを操作できる日は、人間と機械の関係を理解する方法を一変させるという大きな一歩だと思います。