Дропбок побољшава своје „машинско учење“ како би пронашао садржај у ПДФ текстовима и сликама

Тхе облаци за складиштење Они савршено испуњавају своју сврху. Међутим, спор око тога ко нуди бољу услугу све више ескалира. Циљ ових компанија је технолошки се издвајају од осталих да понуди алате које друге платформе не нуде.

Ово је случај Дропбок-а. Прошлог месеца је увео „машинско учење“ на својој платформи. Тако можемо претраживати текст у ПДФ-овима или сликама користећи технологију која успева да индексира већи део садржаја отпремљеног у облак. Данас су управо објавили мере које унапређују ову технологију, и очекује се да ће радити боље него икад.

Премиум функције попут машинског учења за премијум кориснике

Циљ машинског учења је да обезбеди да је сама вештачка интелигенција способна да обавља функције које побољшавају продуктивност корисника. У случају Дропбок-а, ово „машинско учење“ омогућава корисницима тражење међу документима у којима није могло бити јер се као такви не могу индексирати, као што слике могу бити. Ова технологија је заснована на машинском учењу и, наравно, оптичком препознавању карактера (ОЦР).

ОЦР је процес који за циљ има дигитализацију текстова, који аутоматски идентификује симболе или знакове који припадају одређеном алфабету са слике, а затим их чува у облику података.

Корисници са Претплате на Дропбок-ове највише „премиум“ планове сада могу да користе ову алатку. Механика је једноставна: укуцате нешто у претраживач у облаку и он пронађе скоро сваки документ који одговара траженом термину. Проблем са свим овим је био што се формати слика не могу индексирати јер немају текстуални садржај као такав. С друге стране, датотеке са екстензијама ТКСТ, ХТМЛ или ДОЦКС лакше је препознати јер су сами текстови.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Употребљивост овог алата је бескрајна. Замислите да фотографишемо рачун за струју за август месец. Ако којим случајем не пронађемо ту потврду и са сигурношћу знамо да смо је похранили у Дропбок; Са сигурношћу знамо да ће Дропбоково „машинско учење“ индексирати садржај те фотографије и информације ће нам бити приказане за само неколико секунди.


Пратите нас на Гоогле вестима

Оставите свој коментар

Ваша емаил адреса неће бити објављена. Обавезна поља су означена са *

*

*

  1. Odgovorni za podatke: AB Internet Networks 2008 SL
  2. Сврха података: Контрола нежељене поште, управљање коментарима.
  3. Легитимација: Ваш пристанак
  4. Комуникација података: Подаци се неће преносити трећим лицима, осим по законској обавези.
  5. Похрана података: База података коју хостује Оццентус Нетворкс (ЕУ)
  6. Права: У било ком тренутку можете ограничити, опоравити и избрисати своје податке.