Dropbox millora la seva «machine learning» per buscar el contingut en textos de PDFs i imatges

Els núvols d'emmagatzematge compleixen a la perfecció la seva comesa. No obstant això, la disputa per qui ofereix un millor servei s'està pujant cada vegada més de nivell. L'objectiu d'aquestes empreses és desmarcar tecnològicament de la resta per oferir eines que altres plataformes no ofereixin.

És el cas de Dropbox. El mes passat va introduir el «machine learning» en tota la seva plataforma. D'aquesta manera podem buscar text en PDFs o imatges mitjançant una tecnologia que aconsegueix indexar gran part de l'contingut pujat al núvol. Avui mateix acaben d'anunciar mesures que milloren aquesta tecnologia, i s'espera que funcioni millor que mai.

Funcions premium com «machine learning» per a usuaris premium

L'objectiu de l'aprenentatge automàtic és aconseguir que la pròpia intel·ligència artificial sigui capaç de realitzar funcions que millorin la productivitat dels usaurios. En el cas de Dropbox, aquest «machine learning» permet als usuaris buscar entre documents en els quals no es podria perquè no són indexables com a tal, com poden ser imatges. Aquesta tecnologia està basada en l'aprenentatge automàtic i, per descomptat, de el reconeixement òptic de caràcters (OCR).

L'OCR és un procés dirigit a la digitalització de textos, els quals identifiquen automàticament a partir d'una imatge símbols o caràcters que pertanyen a un determinat alfabet, per després emmagatzemar-los en forma de dades.

Els usuaris amb les subscripcions als plans més «premium» de Dropbox ja poden utilitzar aquesta eina. La mecànica és senzilla: tecleges alguna cosa al cercador del núvol i et troba gairebé qualsevol document que coincideixi amb el terme buscat. El problema de tot això subjeia en què els formats d'imatge no són indexables perquè no tenen contingut de text com a tal. En canvi, arxius amb extensions TXT, HTML o DOCX són més fàcils de reconèixer perquè en si són textos.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

La usabilitat d'aquesta eina és infinita. Imagineu-vos que fem una foto de el rebut de llum del mes d'agost. Si no trobem, per algun casual, aquest rebut i sabem amb certesa que ho hem emmagatzemat en Dropbox; sabem amb certesa que el «machine learning» de Dropbox haurà indexat el contingut d'aquesta fotografia i se'ns mostrarà la informació en tan sols uns segons.


Segueix-nos a Google News

Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: AB Internet Networks 2008 SL
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.