Dropbox izboljšuje svoje »strojno učenje« za iskanje vsebine v besedilih in slikah PDF

The oblaki za shranjevanje svoje poslanstvo izpolnijo do popolnosti. Spor o tem, kdo ponuja boljše storitve, pa postaja vse večji. Cilj teh podjetij je tehnološko izstopajo od ostalih ponuditi orodja, ki jih druge platforme ne ponujajo.

To je primer Dropboxa. Prejšnji mesec je uvedel strojno učenje na celotni platformi. Tako lahko iščemo besedilo v PDF-jih ali slikah s pomočjo tehnologije, ki uspe indeksirati velik del vsebine, naložene v oblak. Ravno danes so pravkar objavili ukrepi, ki izboljšujejo to tehnologijo, in pričakovano bo delovalo bolje kot kdaj koli prej.

Vrhunske funkcije, kot je strojno učenje za vrhunske uporabnike

Cilj strojnega učenja je narediti umetno inteligenco sposobno za izvajanje funkcij, ki izboljšujejo produktivnost uporabnikov. V primeru Dropboxa to "strojno učenje" uporabnikom omogoča iskanje po dokumentih, ki jih ni bilo mogoče ker jih ni mogoče indeksirati, kot so slike. Ta tehnologija temelji na strojnem učenju in seveda optičnem prepoznavanju znakov (OCR).

OCR je postopek za digitalizacijo besedil, ki na sliki samodejno prepoznajo simbole ali znake, ki pripadajo določeni abecedi, in jih nato shranijo kot podatke.

Uporabniki z Naročniki na bolj "premium" načrte Dropbox-a lahko zdaj uporabljajo to orodje. Mehanika je preprosta: v iskalnik v oblaku vtipkate nekaj in našel bo skoraj vsak dokument, ki se ujema z iskalnim izrazom. Težava pri vsem tem je bila, da slikovnih formatov ni mogoče indeksirati, ker nimajo besedilne vsebine kot take. Po drugi strani pa je datoteke s priponami TXT, HTML ali DOCX lažje prepoznati, ker so same besedila.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Uporabnost tega orodja je neskončna. Predstavljajte si, da fotografiramo račun za elektriko za mesec avgust. Če slučajno ne najdemo tega potrdila in zagotovo vemo, da smo ga shranili v Dropbox; Z zagotovo vemo, da bo Dropboxovo strojno učenje indeksiralo vsebino te fotografije in informacije nam bodo prikazane v samo nekaj sekundah.


Spremljajte nas v Google News

Pustite svoj komentar

Vaš e-naslov ne bo objavljen. Obvezna polja so označena z *

*

*

  1. Odgovoren za podatke: AB Internet Networks 2008 SL
  2. Namen podatkov: Nadzor neželene pošte, upravljanje komentarjev.
  3. Legitimacija: Vaše soglasje
  4. Sporočanje podatkov: Podatki se ne bodo posredovali tretjim osebam, razen po zakonski obveznosti.
  5. Shranjevanje podatkov: Zbirka podatkov, ki jo gosti Occentus Networks (EU)
  6. Pravice: Kadar koli lahko omejite, obnovite in izbrišete svoje podatke.