Dropbox подобрява своето «машинно обучение», за да намира съдържание в PDF текстове и изображения

на облаци за съхранение те изпълняват своята мисия до съвършенство. Спорът за това кой предлага по-добра услуга обаче става все по-висок и по-висок. Целта на тези компании е технологично се открояват от останалите да предлага инструменти, които други платформи не предлагат.

Това е случаят с Dropbox. Миналия месец той представи машинно обучение в цялата си платформа. По този начин можем да търсим текст в PDF файлове или изображения чрез технология, която успява да индексира голяма част от съдържанието, качено в облака. Точно днес току-що обявиха мерки, които подобряват тази технология, и се очаква да работи по-добре от всякога.

Премиум функции като машинно обучение за първокласни потребители

Целта на машинното обучение е да направи самия изкуствен интелект способен да изпълнява функции, които подобряват производителността на потребителите. В случая с Dropbox това „машинно обучение“ позволява на потребителите да търсене в документи, които не биха могли да бъдат защото те не могат да се индексират като такива, както могат да бъдат изображенията. Тази технология се основава на машинно обучение и, разбира се, оптично разпознаване на символи (OCR).

OCR е процес, насочен към цифровизиране на текстове, които автоматично идентифицират символи или символи, които принадлежат на определена азбука от изображение, и след това ги съхраняват като данни.

Потребители с Абонаментите за по-„премиум“ плановете на Dropbox вече могат да използват този инструмент. Механиката е проста: напишете нещо в търсачката в облака и тя ще намери почти всеки документ, който съответства на думата за търсене. Проблемът с всичко това беше, че форматите на изображенията не подлежат на индексиране, тъй като нямат текстово съдържание като такова. От друга страна, файловете с разширения TXT, HTML или DOCX са по-лесни за разпознаване, защото самите те са текстове.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Използваемостта на този инструмент е безкрайна. Представете си, че правим снимка на сметката за ток за месец август. Ако случайно не намерим тази разписка и със сигурност знаем, че сме я съхранили в Dropbox; със сигурност знаем, че машинното обучение на Dropbox ще е индексирало съдържанието на тази снимка и информацията ще ни бъде показана само за няколко секунди.


Следвайте ни в Google Новини

Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорник за данните: AB Internet Networks 2008 SL
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.