Dropbox poboljšava svoje „mašinsko učenje“ kako bi pronašao sadržaj u PDF tekstovima i slikama

u skladišni oblaci ispunjavaju svoju misiju do savršenstva. Međutim, spor oko toga ko nudi bolju uslugu sve je veći i veći. Cilj ovih kompanija je tehnološki se ističu od ostalih ponuditi alate koje druge platforme ne nude.

Ovo je slučaj sa Dropboxom. Prošlog mjeseca je uveo mašinsko učenje na cijeloj svojoj platformi. Tako možemo pretraživati ​​tekst u PDF-ovima ili slikama pomoću tehnologije koja uspijeva indeksirati veliki dio sadržaja otpremljenog u oblak. Upravo danas su upravo najavili mjere koje poboljšavaju ovu tehnologiju, i očekuje se da će raditi bolje nego ikad.

Premium funkcije kao što je mašinsko učenje za premium korisnike

Cilj mašinskog učenja je učiniti umjetnu inteligenciju sposobnom za obavljanje funkcija koje poboljšavaju korisničku produktivnost. U slučaju Dropboxa, ovo „mašinsko učenje“ omogućava korisnicima pretražujte dokumente koji to ne mogu biti jer se kao takve ne mogu indeksirati, kao što to mogu biti i slike. Ova tehnologija temelji se na mašinskom učenju i, naravno, optičkom prepoznavanju znakova (OCR).

OCR je postupak usmjeren na digitalizaciju tekstova koji automatski identificiraju simbole ili znakove koji pripadaju određenoj abecedi sa slike, a zatim ih pohranjuju kao podatke.

Korisnici sa Pretplata na "premium" planove Dropboxa sada može koristiti ovaj alat. Mehanika je jednostavna: utipkate nešto u pretraživač u oblaku i on će pronaći gotovo bilo koji dokument koji se podudara s pojmom za pretraživanje. Problem svega ovoga bio je što formati slika nisu indeksibilni jer nemaju tekstualni sadržaj kao takav. Suprotno tome, datoteke s TXT, HTML ili DOCX ekstenzijama je lakše prepoznati jer su same tekst.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Korisnost ovog alata je beskonačna. Zamislite da fotografiramo račun za struju za avgust. Ako kojim slučajem ne pronađemo tu potvrdu i sigurno znamo da smo je pohranili u Dropbox; Sigurno znamo da će Dropbox-ovo mašinsko učenje indeksirati sadržaj te fotografije i informacije će nam biti prikazane za samo nekoliko sekundi.


Pratite nas na Google Vijestima

Ostavite komentar

Vaša e-mail adresa neće biti objavljena. Obavezna polja su označena sa *

*

*

  1. Odgovoran za podatke: AB Internet Networks 2008 SL
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obavezi.
  5. Pohrana podataka: Baza podataka koju hostuje Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.