Dropbox uzlabo «mašīnmācīšanos», lai atrastu saturu PDF tekstos un attēlos

the uzglabāšanas mākoņi viņi pilda savu misiju uz pilnību. Tomēr strīds par to, kurš piedāvā labāku pakalpojumu, kļūst arvien augstāks. Šo uzņēmumu mērķis ir: tehnoloģiski izceļas no pārējiem piedāvāt rīkus, ko citas platformas nepiedāvā.

Tas ir gadījumā ar Dropbox. Pagājušajā mēnesī tā ieviesa mašīnmācīšanos visā platformā. Tādējādi mēs varam meklēt tekstu PDF formātā vai attēlos, izmantojot tehnoloģiju, kas spēj indeksēt lielu daļu mākonī augšupielādētā satura. Tieši šodien viņi tikko paziņoja pasākumi, kas uzlabo šo tehnoloģiju, un paredzams, ka tas darbosies labāk nekā jebkad agrāk.

Premium funkcijas, piemēram, mašīnmācīšanās premium lietotājiem

Mašīnmācīšanās mērķis ir padarīt mākslīgo intelektu spējīgu veikt funkcijas, kas uzlabo lietotāju produktivitāti. Dropbox gadījumā šī "mašīnmācīšanās" ļauj lietotājiem to darīt meklēt, izmantojot dokumentus, kas nevar būt jo tie nav indeksējami kā tādi, kā var būt attēli. Šīs tehnoloģijas pamatā ir mašīnmācīšanās un, protams, rakstzīmju optiskā atpazīšana (OCR).

OCR ir process, kura mērķis ir digitalizēt tekstus, kas automātiski no attēla identificē simbolus vai rakstzīmes, kas pieder noteiktam alfabētam, un pēc tam tos saglabā kā datus.

Lietotāji ar Abonējot Dropbox vairāk "premium" plānu, tagad var izmantot šo rīku. Mehānika ir vienkārša: jūs ievadāt kaut ko mākoņa meklētājprogrammā, un tas atradīs gandrīz jebkuru dokumentu, kas atbilst meklēšanas vienumam. Problēma ar to visu bija tā, ka attēlu formāti nav indeksējami, jo tiem nav teksta satura kā tāda. Turpretī failus ar TXT, HTML vai DOCX paplašinājumiem ir vieglāk atpazīt, jo tie paši ir teksts.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Šī rīka lietojamība ir bezgalīga. Iedomājieties, ka mēs nofotografējam elektrības rēķinu par augusta mēnesi. Ja mēs nejauši neatrodam šo kvīti un mēs droši zinām, ka esam to glabājuši Dropbox; Mēs noteikti zinām, ka Dropbox mašīnmācīšanās būs indeksējusi šī fotoattēla saturu un informācija tiks parādīta mums tikai dažu sekunžu laikā.


Sekojiet mums pakalpojumā Google ziņas

Atstājiet savu komentāru

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti ar *

*

*

  1. Atbildīgais par datiem: AB Internet Networks 2008 SL
  2. Datu mērķis: SPAM kontrole, komentāru pārvaldība.
  3. Legitimācija: jūsu piekrišana
  4. Datu paziņošana: Dati netiks paziņoti trešām personām, izņemot juridiskus pienākumus.
  5. Datu glabāšana: datu bāze, ko mitina Occentus Networks (ES)
  6. Tiesības: jebkurā laikā varat ierobežot, atjaunot un dzēst savu informāciju.