Dropbox meningkatkan «pembelajaran mesin» untuk menemukan konten dalam teks dan gambar PDF

itu awan penyimpanan mereka memenuhi misi mereka menuju kesempurnaan. Namun, perselisihan tentang siapa yang menawarkan layanan yang lebih baik semakin tinggi. Tujuan dari perusahaan-perusahaan ini adalah menonjol secara teknologi dari yang lain untuk menawarkan alat yang tidak ditawarkan oleh platform lain.

Ini adalah kasus Dropbox. Bulan lalu, Google memperkenalkan pembelajaran mesin di seluruh platformnya. Jadi kita bisa mencari teks dalam PDF atau gambar melalui teknologi yang berhasil mengindeks sebagian besar konten yang diunggah ke cloud. Baru hari ini mereka baru saja mengumumkan langkah-langkah yang meningkatkan teknologi ini, dan diharapkan bekerja lebih baik dari sebelumnya.

Fitur premium seperti pembelajaran mesin untuk pengguna premium

Tujuan pembelajaran mesin adalah membuat kecerdasan buatan itu sendiri mampu melakukan fungsi yang meningkatkan produktivitas pengguna. Dalam kasus Dropbox, "pembelajaran mesin" ini memungkinkan pengguna untuk mencari melalui dokumen yang tidak mungkin karena mereka tidak dapat diindeks seperti gambar. Teknologi ini didasarkan pada pembelajaran mesin dan, tentu saja, Optical Character Recognition (OCR).

OCR adalah proses yang bertujuan untuk mendigitalkan teks, yang secara otomatis mengidentifikasi simbol atau karakter yang termasuk dalam alfabet tertentu dari sebuah gambar, dan kemudian menyimpannya sebagai data.

Pengguna dengan Langganan ke paket yang lebih "premium" dari Dropbox sekarang dapat menggunakan alat ini. Mekanismenya sederhana: Anda mengetik sesuatu di mesin pencari cloud dan ia akan menemukan hampir semua dokumen yang cocok dengan istilah pencarian. Masalah dengan semua ini adalah bahwa format gambar tidak dapat diindeks karena tidak memiliki konten teks seperti itu. Di sisi lain, file dengan ekstensi TXT, HTML, atau DOCX lebih mudah dikenali karena merupakan teks itu sendiri.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Kegunaan alat ini tidak terbatas. Bayangkan kita mengambil foto tagihan listrik bulan Agustus. Jika kami tidak menemukan, kebetulan, tanda terima itu dan kami tahu pasti bahwa kami telah menyimpannya di Dropbox; Kami tahu pasti bahwa pembelajaran mesin Dropbox akan mengindeks konten foto itu dan informasinya akan ditampilkan kepada kami hanya dalam beberapa detik.


Ikuti kami di Google Berita

tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Bertanggung jawab atas data: AB Internet Networks 2008 SL
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.