Dropbox parantaa «koneoppimista» löytääkseen sisältöä PDF-tiedostoista ja kuvista

Las varastointi pilviä he täyttävät tehtävänsä täydellisyyteen. Kiista siitä, kuka tarjoaa paremman palvelun, on kuitenkin yhä korkeampi. Näiden yritysten tavoite on erottuu teknologisesti muista tarjota työkaluja, joita muut käyttöympäristöt eivät tarjoa.

Tämä on Dropboxin tapaus. Viime kuussa se esitteli koneoppimisen koko alustallaan. Täten voimme etsiä tekstiä PDF-tiedostoina tai kuvina tekniikan avulla, joka onnistuu indeksoimaan suuren osan pilveen ladatusta sisällöstä. Juuri tänään he vain ilmoittivat toimenpiteet, jotka parantavat tätä tekniikkaa, ja sen odotetaan toimivan paremmin kuin koskaan.

Ensiluokkaiset ominaisuudet, kuten koneoppiminen premium-käyttäjille

Koneoppimisen tavoitteena on tehdä tekoälystä kykenevä suorittamaan toimintoja, jotka parantavat käyttäjien tuottavuutta. Dropboxin tapauksessa tämä "koneoppiminen" antaa käyttäjille mahdollisuuden etsiä asiakirjoista, joita ei voi olla koska niitä ei voida indeksoida sellaisenaan, kuten kuvat voivat olla. Tämä tekniikka perustuu koneoppimiseen ja tietenkin optiseen merkintunnistukseen (OCR).

OCR on prosessi, jolla pyritään digitalisoimaan tekstit, joka tunnistaa kuvasta automaattisesti tiettyyn aakkoseen kuuluvat symbolit ja merkit ja tallentaa ne sitten datana.

Käyttäjät, joilla on Dropboxin "premium" -suunnitelmien tilaukset voivat nyt käyttää tätä työkalua. Mekaniikka on yksinkertaista: kirjoitat jotain pilvihakukoneeseen ja se löytää melkein kaikki hakutermiä vastaavat asiakirjat. Kaiken tämän ongelmana oli, että kuvamuotoja ei voida indeksoida, koska niillä ei ole sellaisenaan tekstisisältöä. Toisaalta TXT-, HTML- tai DOCX-laajennuksilla varustetut tiedostot on helpompi tunnistaa, koska ne ovat itse tekstejä.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Tämän työkalun käytettävyys on rajaton. Kuvittele, että otamme valokuvan elokuun sähkölaskusta. Jos emme missään tapauksessa löydä kuittia ja tiedämme varmasti, että olemme tallentaneet sen Dropboxiin; tiedämme varmasti, että Dropboxin koneoppiminen on indeksoinut valokuvan sisällön ja tiedot näytetään meille muutamassa sekunnissa.


Seuraa meitä Google-uutisissa

Jätä kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

*

*

  1. Vastaa tiedoista: AB Internet Networks 2008 SL
  2. Tietojen tarkoitus: Roskapostin hallinta, kommenttien hallinta.
  3. Laillistaminen: Suostumuksesi
  4. Tietojen välittäminen: Tietoja ei luovuteta kolmansille osapuolille muutoin kuin lain nojalla.
  5. Tietojen varastointi: Occentus Networks (EU) isännöi tietokantaa
  6. Oikeudet: Voit milloin tahansa rajoittaa, palauttaa ja poistaa tietojasi.