ड्रॉपबॉक्स पीडीएफ पाठ और छवियों में सामग्री खोजने के लिए अपने «मशीन सीखने» में सुधार करता है

लास भंडारण बादल वे अपना काम बखूबी करते हैं. हालाँकि, कौन बेहतर सेवा प्रदान करता है, इस पर विवाद और अधिक बढ़ता जा रहा है। इन कंपनियों का लक्ष्य है तकनीकी रूप से बाकियों से अलग दिखें ऐसे उपकरण पेश करना जो अन्य प्लेटफ़ॉर्म पेश नहीं करते हैं।

यह ड्रॉपबॉक्स का मामला है। पिछले महीने इसने अपने पूरे प्लेटफॉर्म पर मशीन लर्निंग की शुरुआत की थी। इस प्रकार हम टेक्स्ट खोज सकते हैं पीडीएफ या छवियों में एक ऐसी तकनीक का उपयोग करना जो क्लाउड पर अपलोड की गई सामग्री के एक बड़े हिस्से को अनुक्रमित करने का प्रबंधन करती है। उन्होंने आज ही घोषणा की इस तकनीक को बेहतर बनाने वाले उपाय, और इसके पहले से बेहतर काम करने की उम्मीद है।

प्रीमियम उपयोगकर्ताओं के लिए मशीन लर्निंग जैसी प्रीमियम सुविधाएँ

मशीन लर्निंग का उद्देश्य कृत्रिम बुद्धिमत्ता को स्वयं उन कार्यों को करने में सक्षम बनाना है जो उपयोगकर्ता उत्पादकता में सुधार करते हैं। ड्रॉपबॉक्स के मामले में, यह "मशीन लर्निंग" उपयोगकर्ताओं को इसकी अनुमति देता है उन दस्तावेज़ों को खोजें जो नहीं मिल सके क्योंकि वे छवियों की तरह अनुक्रमित नहीं किए जा सकते हैं। यह तकनीक मशीन लर्निंग और निश्चित रूप से ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) पर आधारित है।

OCR टेक्स्ट के डिजिटलीकरण के उद्देश्य से एक प्रक्रिया है, जो स्वचालित रूप से एक छवि प्रतीकों या वर्णों से पहचानती है जो एक निश्चित वर्णमाला से संबंधित हैं, और फिर उन्हें डेटा के रूप में संग्रहीत करते हैं।

उपयोगकर्ताओं के पास ड्रॉपबॉक्स की सबसे "प्रीमियम" योजनाओं की सदस्यता पहले से ही इस टूल का उपयोग कर सकती है। कार्यप्रणाली सरल है: आप क्लाउड सर्च इंजन में कुछ टाइप करते हैं और यह खोज शब्द से मेल खाने वाला लगभग कोई भी दस्तावेज़ ढूंढ लेता है। इन सबके साथ समस्या यह थी कि छवि प्रारूप अनुक्रमणीय नहीं होते क्योंकि उनमें पाठ्य सामग्री नहीं होती। दूसरी ओर, TXT, HTML या DOCX एक्सटेंशन वाली फ़ाइलों को पहचानना आसान होता है क्योंकि वे स्वयं टेक्स्ट होते हैं।

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

इस उपकरण की उपयोगिता अनंत है. कल्पना कीजिए कि हम अगस्त महीने के बिजली बिल की फोटो लेते हैं। यदि किसी संयोग से हमें वह रसीद नहीं मिलती है और हम निश्चित रूप से जानते हैं कि हमने उसे ड्रॉपबॉक्स में संग्रहीत किया है; हम निश्चित रूप से जानते हैं कि ड्रॉपबॉक्स की मशीन लर्निंग ने उस फोटो की सामग्री को अनुक्रमित कर लिया होगा और हमें कुछ ही सेकंड में जानकारी दिखा दी जाएगी।


Google समाचार पर हमारा अनुसरण करें

अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: एबी इंटरनेट नेटवर्क 2008 SL
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।