Dropboxは、「機械学習」を改善して、PDFテキストや画像のコンテンツを検索します

ラス ストレージクラウド 彼らは完璧への使命を果たします。 しかし、誰がより良いサービスを提供するかをめぐる論争はますます高まっています。 これらの会社の目的は 技術的に他から際立っている 他のプラットフォームが提供していないツールを提供するため。

これはDropboxの場合です。 先月、プラットフォーム全体に機械学習を導入しました。 したがって、 テキストを検索できます クラウドにアップロードされたコンテンツの大部分にインデックスを付けることを管理するテクノロジーを介してPDFまたは画像で。 ちょうど今日彼らはちょうど発表しました この技術を改善する手段、 そしてそれはこれまで以上にうまくいくことが期待されています。

プレミアムユーザー向けの機械学習などのプレミアム機能

機械学習の目標は、人工知能自体がユーザーの生産性を向上させる機能を実行できるようにすることです。 Dropboxの場合、この「機械学習」により、ユーザーは次のことができます。 できなかったドキュメントを検索する 画像のように、それ自体は索引付けできないためです。 このテクノロジーは、機械学習と、もちろん光学式文字認識(OCR)に基づいています。

OCRは、テキストをデジタル化することを目的としたプロセスであり、画像から特定のアルファベットに属する記号または文字を自動的に識別し、それらをデータとして保存します。

のユーザー Dropboxのより「プレミアム」プランへのサブスクリプションでこのツールを使用できるようになりました。 仕組みは単純です。クラウド検索エンジンに何かを入力すると、検索語に一致するほぼすべてのドキュメントが検索されます。 これらすべての問題は、画像形式自体にテキストコンテンツがないため、画像形式にインデックスを付けることができないことでした。 一方、TXT、HTML、またはDOCX拡張子の付いたファイルは、それ自体がテキストであるため、認識しやすくなっています。

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

このツールの使いやすさは無限大です。 XNUMX月の電気代の写真を撮ると想像してみてください。 万が一、その領収書が見つからず、Dropboxに保存されていることが確実にわかっている場合。 Dropboxの機械学習によってその写真のコンテンツがインデックスに登録され、情報が数秒で表示されることは間違いありません。


Google ニュースでフォローしてください

コメントを最初に

コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:AB Internet Networks 2008 SL
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。