Dropbox вдосконалює «машинне навчання», щоб знаходити вміст у текстах PDF та зображеннях

The сховища хмар вони досконало виконують свою місію. Однак суперечка щодо того, хто пропонує кращі послуги, стає дедалі вищою. Метою цих компаній є технологічно виділяються з-поміж інших пропонувати інструменти, яких інші платформи не пропонують.

Це випадок Dropbox. Минулого місяця компанія представила машинне навчання на всій своїй платформі. Таким чином ми можемо шукати текст в PDF-файлах або зображеннях за допомогою технології, яка дозволяє індексувати значну частину вмісту, завантаженого в хмару. Тільки сьогодні вони щойно оголосили заходи, що покращують цю технологію, і, як очікується, він працюватиме як ніколи раніше.

Преміум-функції, такі як машинне навчання для преміум-користувачів

Мета машинного навчання - зробити сам штучний інтелект здатним виконувати функції, що покращують продуктивність користувачів. У випадку з Dropbox це "машинне навчання" дозволяє користувачам пошук у документах, яких не могло бути оскільки вони не піддаються індексації як такі, як це можуть бути зображення. Ця технологія заснована на машинному навчанні та, звичайно, оптичному розпізнаванні символів (OCR).

OCR - це процес, спрямований на оцифрування текстів, який автоматично визначає символи або символи, що належать певному алфавіту, із зображення, а потім зберігає їх як дані.

Користувачі з Підписки на більш "преміальні" плани Dropbox тепер можуть використовувати цей інструмент. Механіка проста: ви вводите щось у хмарній пошуковій системі, і вона знайде майже будь-який документ, який відповідає пошуковому терміну. Проблема у всьому цьому полягала в тому, що формати зображень не можна індексувати, оскільки вони не мають текстового вмісту як такого. З іншого боку, файли з розширеннями TXT, HTML або DOCX легше розпізнати, оскільки вони самі є текстом.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Корисність цього інструменту нескінченна. Уявіть, що ми фотографуємо рахунок за електроенергію за серпень. Якщо ми випадково не знайдемо цю квитанцію, і ми точно знаємо, що зберегли її в Dropbox; Ми точно знаємо, що машинне навчання Dropbox проіндексувало вміст цієї фотографії, і інформація буде показана нам всього за кілька секунд.


Слідкуйте за нами в Новинах Google

Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: AB Internet Networks 2008 SL
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.