דרופבוקס משפרת את "למידת המכונה" שלה כדי למצוא תוכן בטקסטים ותמונות PDF

לאס ענני אחסון הם ממלאים את משימתם לשלמות. עם זאת, המחלוקת לגבי מי מציע שירות טוב יותר הולכת וגוברת. המטרה של חברות אלה היא מבחינה טכנולוגית מבין השאר להציע כלים שפלטפורמות אחרות אינן מציעות.

זה המקרה של דרופבוקס. בחודש שעבר הציגה למידת מכונה בכל הפלטפורמה שלה. לכן אנחנו יכולים לחפש טקסט בקובצי PDF או תמונות באמצעות טכנולוגיה שמצליחה להוסיף לאינדקס חלק גדול מהתוכן שהועלה לענן. רק היום הם פשוט הודיעו אמצעים המשפרים טכנולוגיה זו, והוא צפוי לעבוד טוב מתמיד.

תכונות פרימיום כגון למידת מכונה למשתמשי פרימיום

המטרה של למידת מכונה היא להפוך את הבינה המלאכותית עצמה למסוגלת לבצע פונקציות המשפרות את פרודוקטיביות המשתמשים. במקרה של Dropbox, "למידת מכונה" זו מאפשרת למשתמשים חפש במסמכים שלא יכולים להיות מכיוון שהם אינם ניתנים לאינדקס ככאלה, כמו תמונות. טכנולוגיה זו מבוססת על למידת מכונה וכמובן זיהוי תווים אופטי (OCR).

OCR הוא תהליך שמטרתו דיגיטציה של טקסטים, שמזהים אוטומטית סמלים או תווים השייכים לאלף-בית מסוים מתוך תמונה ואז מאחסנים אותם כנתונים.

משתמשים עם מנויים לתוכניות ה"פרימיום "היותר יפות של Dropbox יכולים כעת להשתמש בכלי זה. המכניקה פשוטה: אתה מקליד משהו במנוע החיפוש בענן והוא ימצא כמעט כל מסמך התואם למונח החיפוש. הבעיה עם כל זה הייתה שפורמטי התמונה אינם ניתנים לאינדקס מכיוון שאין בהם תוכן טקסט ככזה. מצד שני, קל יותר לזהות קבצים עם סיומות TXT, HTML או DOCX מכיוון שהם טקסטים בעצמם.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

השימושיות של כלי זה היא אינסופית. דמיין שאנחנו מצלמים את חשבון החשמל לחודש אוגוסט. אם לא נמצא, במקרה, את הקבלה הזו ואנחנו יודעים בוודאות שאחסנו אותה ב- Dropbox; אנו יודעים בוודאות כי למידת המכונה של דרופבוקס תוסיף לאינדקס את התוכן של אותה תמונה והמידע יוצג לנו תוך מספר שניות בלבד.


עקוב אחרינו בחדשות Google

השאירו את התגובה שלכם

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

*

*

  1. אחראי על הנתונים: AB Internet Networks 2008 SL
  2. מטרת הנתונים: בקרת ספאם, ניהול תגובות.
  3. לגיטימציה: הסכמתך
  4. מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
  5. אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
  6. זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.