Dropbox forbedrer sin «machine learning» for at finde indhold i PDF-tekster og -billeder

den opbevaringsskyer De gør deres arbejde perfekt. Men striden om, hvem der tilbyder en bedre service, bliver mere og mere niveau. Målet for disse virksomheder er skiller sig teknologisk ud fra resten at tilbyde værktøjer, som andre platforme ikke tilbyder.

Det er tilfældet med Dropbox. I sidste måned introducerede det maskinlæring på tværs af hele sin platform. Dermed vi kan søge tekst i PDF'er eller billeder ved hjælp af en teknologi, der formår at indeksere en stor del af det indhold, der uploades til skyen. netop annonceret i dag foranstaltninger, der forbedrer denne teknologi, og det forventes at fungere bedre end nogensinde.

Premium-funktioner som maskinlæring til premium-brugere

Målet med maskinlæring er at gøre kunstig intelligens i sig selv i stand til at udføre funktioner, der forbedrer brugerens produktivitet. I tilfælde af Dropbox giver denne "machine learning" brugerne mulighed for det søge i dokumenter, der ikke kunne findes fordi de ikke kan indekseres som sådan, som det kan være billeder. Denne teknologi er baseret på maskinlæring og selvfølgelig optisk tegngenkendelse (OCR).

OCR er en proces rettet mod digitalisering af tekster, som automatisk identificerer fra et billede symboler eller tegn, der hører til et bestemt alfabet, og derefter gemmer dem i form af data.

Brugerne med abonnementer på Dropbox's mest "premium"-planer kan allerede bruge dette værktøj. Mekanikken er enkel: du skriver noget i skysøgemaskinen, og den finder næsten ethvert dokument, der matcher søgetermen. Problemet med alt dette var, at billedformater ikke kan indekseres, fordi de ikke har tekstindhold som sådan. På den anden side er filer med TXT-, HTML- eller DOCX-udvidelser nemmere at genkende, fordi de selv er tekster.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Brugbarheden af ​​dette værktøj er uendelig. Forestil dig, at vi tager et billede af elregningen for august måned. Hvis vi ved et tilfælde ikke finder den kvittering, og vi ved med sikkerhed, at vi har gemt den i Dropbox; vi ved med sikkerhed, at Dropbox's machine learning vil have indekseret indholdet af billedet, og vi vil få vist informationen på få sekunder.


Følg os på Google Nyheder

Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for data: AB Internet Networks 2008 SL
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.