Dropbox vylepšuje své «strojové učení», aby našel obsah v textech a obrázcích PDF

the skladovací mraky plní své poslání k dokonalosti. Spor o to, kdo nabízí lepší služby, se však stále zvyšuje. Cílem těchto společností je technologicky vyčnívat ze zbytku nabízet nástroje, které jiné platformy nenabízejí.

To je případ Dropboxu. Minulý měsíc představila strojové učení na celé své platformě. Tím pádem můžeme hledat text v souborech PDF nebo obrázcích prostřednictvím technologie, která dokáže indexovat velkou část obsahu nahraného do cloudu. Právě dnes právě oznámili opatření, která tuto technologii vylepšují, a očekává se, že bude fungovat lépe než kdy dříve.

Prémiové funkce, jako je strojové učení, pro prémiové uživatele

Cílem strojového učení je vytvořit umělou inteligenci samotnou schopnou vykonávat funkce, které zlepšují produktivitu uživatelů. V případě Dropboxu toto „strojové učení“ umožňuje uživatelům prohledávat dokumenty, které nemohly být protože nejsou indexovatelné jako takové, jako mohou být obrázky. Tato technologie je založena na strojovém učení a samozřejmě na optickém rozpoznávání znaků (OCR).

OCR je proces zaměřený na digitalizaci textů, který z obrázku automaticky identifikuje symboly nebo znaky, které patří k určité abecedě, a poté je ukládá jako data.

Uživatelé s Tento nástroj nyní může využívat předplatné „prémiovějších“ plánů Dropboxu. Mechanika je jednoduchá: zadáte něco do cloudového vyhledávače a najde téměř jakýkoli dokument, který odpovídá hledanému výrazu. Problém v tom všem byl, že obrazové formáty nelze indexovat, protože nemají samotný textový obsah. Na druhou stranu, soubory s příponami TXT, HTML nebo DOCX jsou snáze rozpoznatelné, protože jsou to samotné texty.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Použitelnost tohoto nástroje je nekonečná. Představte si, že vyfotíme účet za elektřinu za měsíc srpen. Pokud náhodou nenalezneme toto potvrzení a víme jistě, že jsme jej uložili do Dropboxu; s jistotou víme, že strojové učení Dropboxu bude indexovat obsah této fotografie a informace se nám zobrazí během několika sekund.


Sledujte nás ve Zprávách Google

Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Za data odpovídá: AB Internet Networks 2008 SL
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.