Dropbox vylepšuje svoje «strojové učenie» na vyhľadanie obsahu v textoch a obrázkoch PDF

L skladovacie oblaky plnia svoje poslanie k dokonalosti. Spory o to, kto ponúka lepšie služby, sú však čoraz vyššie. Cieľom týchto spoločností je technologicky vyčnievať od ostatných ponúkať nástroje, ktoré iné platformy neponúkajú.

To je prípad Dropboxu. Minulý mesiac predstavila strojové učenie na celej svojej platforme. Teda môžeme vyhľadávať text v PDF alebo obrázkoch pomocou technológie, ktorá dokáže indexovať veľkú časť obsahu nahraného do cloudu. Práve dnes práve oznámili opatrenia, ktoré zlepšujú túto technológiu, a očakáva sa, že bude fungovať lepšie ako kedykoľvek predtým.

Prémiové funkcie ako strojové učenie pre prémiových používateľov

Cieľom strojového učenia je umožniť samotnej umelej inteligencii vykonávať funkcie, ktoré zlepšujú produktivitu používateľov. V prípade Dropboxu toto „strojové učenie“ umožňuje používateľom prehľadávať dokumenty, ktoré nemôžu byť pretože nie sú indexovateľné ako také, ako môžu byť obrázky. Táto technológia je založená na strojovom učení a samozrejme na optickom rozpoznávaní znakov (OCR).

OCR je proces zameraný na digitalizáciu textov, ktorý z obrázka automaticky identifikuje symboly alebo znaky, ktoré patria k určitej abecede, a potom ich ukladá ako údaje.

Používatelia s Tento nástroj teraz môžu využívať predplatné na „prémiovejšie“ plány Dropboxu. Mechanika je jednoduchá: zadáte niečo do cloudového vyhľadávacieho nástroja a nájde takmer každý dokument, ktorý sa zhoduje s hľadaným výrazom. Problém s tým všetkým bol, že obrazové formáty nie sú indexovateľné, pretože nemajú samotný textový obsah. Na druhej strane, súbory s príponami TXT, HTML alebo DOCX sú ľahšie rozpoznateľné, pretože sú to texty samotné.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Použiteľnosť tohto nástroja je nekonečná. Predstavte si, že odfotíme účet za elektrinu za mesiac august. Ak nenájdeme ani náhodou toto potvrdenie a určite vieme, že sme ho uložili v Dropboxe; Sme si istí, že strojové učenie Dropboxu indexuje obsah tejto fotografie a informácie sa nám zobrazia za pár sekúnd.


Sledujte nás na Google News

Zanechajte svoj komentár

Vaša e-mailová adresa nebude zverejnená. Povinné položky sú označené *

*

*

  1. Za údaje zodpovedá: AB Internet Networks 2008 SL
  2. Účel údajov: Kontrolný SPAM, správa komentárov.
  3. Legitimácia: Váš súhlas
  4. Oznamovanie údajov: Údaje nebudú poskytnuté tretím stranám, iba ak to vyplýva zo zákona.
  5. Ukladanie dát: Databáza hostená spoločnosťou Occentus Networks (EU)
  6. Práva: Svoje údaje môžete kedykoľvek obmedziť, obnoviť a vymazať.