Dropbox meningkatkan «pembelajaran mesin» untuk mencari kandungan dalam teks dan gambar PDF

yang awan simpanan mereka memenuhi misi mereka untuk mencapai kesempurnaan. Walau bagaimanapun, pertikaian mengenai siapa yang menawarkan perkhidmatan yang lebih baik semakin tinggi. Objektif syarikat-syarikat ini adalah secara teknikal menonjol dari yang lain untuk menawarkan alat yang tidak ditawarkan oleh platform lain.

Ini adalah kes Dropbox. Bulan lalu ia memperkenalkan pembelajaran mesin di seluruh platformnya. Oleh itu kita boleh mencari teks dalam PDF atau gambar menggunakan teknologi yang berjaya mengindeks sebahagian besar kandungan yang dimuat naik ke awan. Baru hari ini mereka baru sahaja mengumumkan langkah-langkah yang meningkatkan teknologi ini, dan ia diharapkan dapat berfungsi lebih baik dari sebelumnya.

Ciri-ciri premium seperti pembelajaran mesin untuk pengguna premium

Matlamat pembelajaran mesin adalah untuk membuat kecerdasan buatan sendiri yang mampu melaksanakan fungsi yang meningkatkan produktiviti pengguna. Dalam kes Dropbox, "pembelajaran mesin" ini memungkinkan pengguna untuk cari melalui dokumen yang tidak mungkin kerana ia tidak dapat diindeks seperti itu, seperti gambar. Teknologi ini berdasarkan pembelajaran mesin dan, tentu saja, Pengiktirafan Karakter Optik (OCR).

OCR adalah proses yang bertujuan untuk mendigitalkan teks, yang secara automatik mengenal pasti simbol atau watak yang tergolong dalam abjad tertentu dari gambar, dan kemudian menyimpannya sebagai data.

Pengguna dengan Langganan rancangan Dropbox yang lebih "premium" kini boleh menggunakan alat ini. Mekaniknya mudah: anda menaip sesuatu di mesin pencari di awan dan ia akan menemui hampir semua dokumen yang sesuai dengan istilah carian. Masalah dengan semua ini ialah format gambar tidak dapat diindeks kerana tidak mempunyai kandungan teks seperti itu. Sebaliknya, fail dengan sambungan TXT, HTML atau DOCX lebih mudah dikenali kerana ia adalah teks itu sendiri.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Kebolehgunaan alat ini tidak terhingga. Bayangkan kita mengambil gambar bil elektrik untuk bulan Ogos. Sekiranya kami tidak menemui, secara kebetulan, resit itu dan kami pasti tahu bahawa kami telah menyimpannya di Dropbox; Kami tahu dengan pasti bahawa pembelajaran mesin Dropbox akan mengindeks kandungan foto itu dan maklumat akan ditunjukkan kepada kami hanya dalam beberapa saat.


Ikuti kami di Google News

Tinggalkan komen anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda dengan *

*

*

  1. Bertanggungjawab untuk data: AB Internet Networks 2008 SL
  2. Tujuan data: Mengendalikan SPAM, pengurusan komen.
  3. Perundangan: Persetujuan anda
  4. Komunikasi data: Data tidak akan disampaikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Pangkalan data yang dihoskan oleh Occentus Networks (EU)
  6. Hak: Pada bila-bila masa anda boleh menghadkan, memulihkan dan menghapus maklumat anda.