на облаци за съхранение те изпълняват своята мисия до съвършенство. Спорът за това кой предлага по-добра услуга обаче става все по-висок и по-висок. Целта на тези компании е технологично се открояват от останалите да предлага инструменти, които други платформи не предлагат.
Това е случаят с Dropbox. Миналия месец той представи машинно обучение в цялата си платформа. По този начин можем да търсим текст в PDF файлове или изображения чрез технология, която успява да индексира голяма част от съдържанието, качено в облака. Точно днес току-що обявиха мерки, които подобряват тази технология, и се очаква да работи по-добре от всякога.
Премиум функции като машинно обучение за първокласни потребители
Целта на машинното обучение е да направи самия изкуствен интелект способен да изпълнява функции, които подобряват производителността на потребителите. В случая с Dropbox това „машинно обучение“ позволява на потребителите да търсене в документи, които не биха могли да бъдат защото те не могат да се индексират като такива, както могат да бъдат изображенията. Тази технология се основава на машинно обучение и, разбира се, оптично разпознаване на символи (OCR).
OCR е процес, насочен към цифровизиране на текстове, които автоматично идентифицират символи или символи, които принадлежат на определена азбука от изображение, и след това ги съхраняват като данни.
Потребители с Абонаментите за по-„премиум“ плановете на Dropbox вече могат да използват този инструмент. Механиката е проста: напишете нещо в търсачката в облака и тя ще намери почти всеки документ, който съответства на думата за търсене. Проблемът с всичко това беше, че форматите на изображенията не подлежат на индексиране, тъй като нямат текстово съдържание като такова. От друга страна, файловете с разширения TXT, HTML или DOCX са по-лесни за разпознаване, защото самите те са текстове.
El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.
Използваемостта на този инструмент е безкрайна. Представете си, че правим снимка на сметката за ток за месец август. Ако случайно не намерим тази разписка и със сигурност знаем, че сме я съхранили в Dropbox; със сигурност знаем, че машинното обучение на Dropbox ще е индексирало съдържанието на тази снимка и информацията ще ни бъде показана само за няколко секунди.