Pinapabuti ng Dropbox ang «pag-aaral ng machine» upang makahanap ng nilalaman sa mga teksto at imahe ng PDF

ang mga ulap ng imbakan natutupad nila ang kanilang misyon sa pagiging perpekto. Gayunpaman, ang pagtatalo sa kung sino ang nag-aalok ng isang mas mahusay na serbisyo ay nakakakuha ng mas mataas at mas mataas. Ang layunin ng mga kumpanyang ito ay teknolohikal na tumayo mula sa iba pa upang mag-alok ng mga tool na hindi inaalok ng ibang mga platform.

Ito ang kaso ng Dropbox. Noong nakaraang buwan ipinakilala nito ang pag-aaral ng makina sa buong platform nito. Ganito maaari tayong maghanap ng teksto sa mga PDF o imaheng gumagamit ng isang teknolohiya na nagawang i-index ang isang malaking bahagi ng nilalamang na-upload sa cloud. Ngayon lang sila nag-anunsyo mga hakbang na nagpapabuti sa teknolohiyang ito, at inaasahang gagana ito ng mas mahusay kaysa dati.

Mga premium na tampok tulad ng pag-aaral ng makina para sa mga premium na gumagamit

Ang layunin ng pag-aaral ng makina ay upang gawing mismong artipisyal na intelektuwal na may kakayahang magsagawa ng mga pagpapaandar na nagpapabuti sa pagiging produktibo ng gumagamit. Sa kaso ng Dropbox, pinapayagan ng "machine learning" na ito ang mga gumagamit na maghanap sa pamamagitan ng mga dokumento na hindi maaaring dahil hindi sila nai-index tulad ng, maaaring mga imahe. Ang teknolohiyang ito ay batay sa pag-aaral ng makina at, syempre, Optical Character Recognition (OCR).

Ang OCR ay isang proseso na naglalayong pag-digitize ng mga teksto, na awtomatikong kinikilala ang mga simbolo o character na kabilang sa isang tiyak na alpabeto mula sa isang imahe, at pagkatapos ay iimbak ang mga ito bilang data.

Ang mga gumagamit na may Ang mga subscription sa mas maraming "premium" na mga plano ng Dropbox ay maaari nang gamitin ang tool na ito. Ang mekanika ay simple: nagta-type ka ng isang bagay sa cloud search engine at mahahanap nito ang halos anumang dokumento na tumutugma sa termino para sa paghahanap. Ang problema sa lahat ng ito ay ang mga format ng imahe ay hindi ma-index dahil wala silang nilalaman sa teksto tulad ng. Sa kabilang banda, ang mga file na may mga extension ng TXT, HTML o DOCX ay mas madaling makilala dahil sila mismo ang mga teksto.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Ang kakayahang magamit ng tool na ito ay walang hanggan. Isipin na kunan namin ng larawan ang singil sa kuryente para sa buwan ng Agosto. Kung hindi namin nahanap, sa anumang pagkakataon, ang resibo na iyon at alam naming sigurado na naimbak namin ito sa Dropbox; Alam naming sigurado na ang pag-aaral ng makina ng Dropbox ay mai-index ang nilalaman ng larawang iyon at ipapakita sa amin ang impormasyon sa loob lamang ng ilang segundo.


Sundan kami sa Google News

Iwanan ang iyong puna

Ang iyong email address ay hindi nai-publish. Mga kinakailangang patlang ay minarkahan ng *

*

*

  1. Responsable para sa data: AB Internet Networks 2008 SL
  2. Layunin ng data: Kontrolin ang SPAM, pamamahala ng komento.
  3. Legitimation: Ang iyong pahintulot
  4. Komunikasyon ng data: Ang data ay hindi maiparating sa mga third party maliban sa ligal na obligasyon.
  5. Imbakan ng data: Ang database na naka-host ng Occentus Networks (EU)
  6. Mga Karapatan: Sa anumang oras maaari mong limitahan, mabawi at tanggalin ang iyong impormasyon.