Dropbox forbedrer sin «maskinlæring» for å finne innhold i PDF-tekster og bilder

Las lagringsskyer de oppfyller sitt oppdrag til perfeksjon. Striden om hvem som tilbyr en bedre tjeneste blir imidlertid høyere og høyere. Målet med disse selskapene er teknologisk skiller seg ut fra resten å tilby verktøy som andre plattformer ikke tilbyr.

Dette er tilfellet med Dropbox. I forrige måned introduserte den maskinlæring på hele plattformen. Og dermed vi kan søke i tekst i PDF-filer eller bilder gjennom en teknologi som klarer å indeksere en stor del av innholdet som er lastet opp til skyen. Bare i dag kunngjorde de tiltak som forbedrer denne teknologien, og det forventes at det fungerer bedre enn noensinne.

Premium-funksjoner som maskinlæring for premiumbrukere

Målet med maskinlæring er å gjøre kunstig intelligens i stand til å utføre funksjoner som forbedrer brukerens produktivitet. Når det gjelder Dropbox, tillater denne "maskinlæringen" brukere å søk gjennom dokumenter som ikke kunne være fordi de ikke kan indekseres som sådan, som det kan være bilder. Denne teknologien er basert på maskinlæring og, selvfølgelig, Optical Character Recognition (OCR).

OCR er en prosess rettet mot digitalisering av tekster, som automatisk identifiserer symboler eller tegn som tilhører et bestemt alfabet fra et bilde, og deretter lagrer dem som data.

Brukere med Abonnement på de mer "premium" planene til Dropbox kan nå bruke dette verktøyet. Mekanikken er enkel: du skriver inn noe i skysøkemotoren, og den finner nesten ethvert dokument som samsvarer med søkeordet. Problemet med alt dette var at bildeformatene ikke kan indekseres fordi de ikke har tekstinnhold som sådan. På den annen side er filer med TXT-, HTML- eller DOCX-utvidelser lettere å gjenkjenne fordi de er tekster selv.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Brukervennligheten til dette verktøyet er uendelig. Tenk deg at vi tar et bilde av strømregningen for august måned. Hvis vi ikke finner ut kvitteringen, og vi vet med sikkerhet at vi har lagret den i Dropbox; Vi vet helt sikkert at Dropboxs maskinlæring vil ha indeksert innholdet på det bildet, og informasjonen vil bli vist for oss på bare noen få sekunder.


Følg oss på Google Nyheter

Legg igjen kommentaren

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*

*

  1. Ansvarlig for dataene: AB Internet Networks 2008 SL
  2. Formålet med dataene: Kontroller SPAM, kommentaradministrasjon.
  3. Legitimering: Ditt samtykke
  4. Kommunikasjon av dataene: Dataene vil ikke bli kommunisert til tredjeparter bortsett fra ved juridisk forpliktelse.
  5. Datalagring: Database vert for Occentus Networks (EU)
  6. Rettigheter: Når som helst kan du begrense, gjenopprette og slette informasjonen din.