ड्रॉपबॉक्स पीडीएफ मजकूर आणि प्रतिमांमध्ये सामग्री शोधण्यासाठी त्याचे «मशीन शिक्षण improves सुधारते

अगोदर निर्देश केलेल्या बाबीसंबंधी बोलताना स्टोरेज ढग ते त्यांचे कार्य पूर्णत्वास नेतात. तथापि, चांगली सेवा कोण देते याविषयीचा विवाद अधिक आणि अधिक होत आहे. या कंपन्यांचे उद्दीष्ट आहे तांत्रिकदृष्ट्या उर्वरित पासून उभे इतर प्लॅटफॉर्म ऑफर करत नाहीत अशी साधने ऑफर करण्यासाठी.

ड्रॉपबॉक्सची ही बाब आहे. गेल्या महिन्यात त्याने त्याच्या संपूर्ण व्यासपीठावर मशीन लर्निंगची ओळख केली. अशा प्रकारे आम्ही मजकूर शोधू शकतो मेघवर अपलोड केलेल्या सामग्रीचा मोठा भाग अनुक्रमित करणारी तंत्रज्ञान वापरून पीडीएफ किंवा प्रतिमांमध्ये. आजच त्यांनी घोषणा केली हे तंत्रज्ञान सुधारणारे उपाय, आणि हे नेहमीपेक्षा चांगले कार्य करण्याची अपेक्षा आहे.

प्रीमियम वैशिष्ट्ये जसे प्रीमियम वापरकर्त्यांसाठी मशीन लर्निंग

मशीन शिक्षणाचे उद्दीष्ट म्हणजे कृत्रिम बुद्धिमत्ता स्वत: ला सक्षम बनविणे जे कार्यक्षमता सक्षम करते जे वापरकर्त्याची उत्पादनक्षमता सुधारते. ड्रॉपबॉक्सच्या बाबतीत, हे "मशीन लर्निंग" वापरकर्त्यांना परवानगी देते नसलेल्या कागदपत्रांद्वारे शोधा कारण ते प्रतिमांसारख्या अनुक्रमणिका नसतात. हे तंत्रज्ञान मशीन लर्निंग आणि अर्थातच ऑप्टिकल कॅरेक्टर रिकग्निशन (ओसीआर) वर आधारित आहे.

ओसीआर ही एक प्रक्रिया आहे जी मजकूराचे डिजिटलायझेशन करण्याच्या उद्देशाने आहे, जे प्रतिमेवरून विशिष्ट वर्णमाला संबंधित चिन्हे किंवा वर्ण स्वयंचलितपणे ओळखते आणि नंतर त्यास डेटा म्हणून संचयित करतात.

सह वापरकर्ते ड्रॉपबॉक्सच्या अधिक "प्रीमियम" योजनांच्या सदस्यता आता हे साधन वापरू शकतात. यांत्रिकी सोपे आहेत: आपण मेघमध्ये शोध इंजिनमध्ये काहीतरी टाइप करता आणि त्यास शोध संज्ञेशी जुळणारे जवळजवळ कोणतेही दस्तऐवज सापडतील. या सर्वासह समस्या अशी होती की प्रतिमा स्वरूप अनुक्रमणिक नाहीत कारण त्यांच्याकडे मजकूर सामग्री नसते. याउलट, टीएक्सटी, एचटीएमएल किंवा डीओसीएक्स विस्तार असलेल्या फायली ओळखणे सोपे आहे कारण ते स्वत: मजकूर आहेत.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

या साधनाची उपयोगिता असीम आहे. अशी कल्पना करा की आम्ही ऑगस्ट महिन्यातील विजेच्या बिलाचा फोटो काढला आहे. जर आम्हाला कोणत्याही संधी मिळाल्या नाहीत तर ती पावती सापडली नाही आणि आम्ही ती ड्रॉपबॉक्समध्ये संग्रहित केली आहे हे आम्हाला निश्चितपणे माहित आहे; आम्हाला ठामपणे माहिती आहे की ड्रॉपबॉक्सच्या मशीन लर्निंगने त्या फोटोची अनुक्रमांक तयार केला असेल आणि ती माहिती काही सेकंदात आम्हाला दाखविली जाईल.


Google News वर आमचे अनुसरण करा

आपली टिप्पणी द्या

आपला ई-मेल पत्ता प्रकाशित केला जाणार नाही. आवश्यक फील्ड चिन्हांकित केले आहेत *

*

*

  1. डेटासाठी जबाबदार: AB इंटरनेट नेटवर्क 2008 SL
  2. डेटाचा उद्देशः नियंत्रण स्पॅम, टिप्पणी व्यवस्थापन.
  3. कायदे: आपली संमती
  4. डेटा संप्रेषण: कायदेशीर बंधन वगळता डेटा तृतीय पक्षास कळविला जाणार नाही.
  5. डेटा संग्रहण: ओकेन्टस नेटवर्क (EU) द्वारा होस्ट केलेला डेटाबेस
  6. अधिकारः कोणत्याही वेळी आपण आपली माहिती मर्यादित, पुनर्प्राप्त आणि हटवू शकता.