Dropbox улучшает «машинное обучение» для поиска содержимого в текстах и ​​изображениях PDF.

Лас- облака хранения они выполняют свою миссию в совершенстве. Однако спор о том, кто предлагает лучший сервис, становится все выше и выше. Целью этих компаний является технологически выделяться среди остальных предлагать инструменты, недоступные на других платформах.

Так обстоит дело с Dropbox. В прошлом месяце компания внедрила машинное обучение на всей своей платформе. Таким образом мы можем искать текст в PDF-файлах или изображениях с помощью технологии, позволяющей индексировать большую часть контента, загруженного в облако. Только сегодня они объявили меры, улучшающие эту технологию, и ожидается, что он будет работать лучше, чем когда-либо.

Премиум-функции, такие как машинное обучение для премиум-пользователей

Цель машинного обучения - сделать сам искусственный интеллект способным выполнять функции, повышающие продуктивность пользователей. В случае Dropbox это «машинное обучение» позволяет пользователям поиск по документам, которые не могли быть потому что они не индексируются как таковые, как и изображения. Эта технология основана на машинном обучении и, конечно же, на оптическом распознавании символов (OCR).

OCR - это процесс, направленный на оцифровку текстов, который автоматически идентифицирует символы или символы, принадлежащие определенному алфавиту, на изображении, а затем сохраняет их как данные.

Пользователи с Подписки на более «премиальные» планы Dropbox теперь могут использовать этот инструмент. Механика проста: вы вводите что-то в облачную поисковую систему, и она найдет практически любой документ, соответствующий поисковому запросу. Проблема со всем этим заключалась в том, что форматы изображений не индексируются, потому что они не имеют текстового содержимого как такового. Напротив, файлы с расширениями TXT, HTML или DOCX легче распознать, потому что они сами являются текстом.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Удобство использования этого инструмента безгранично. Представьте, что мы делаем снимок счета за электроэнергию за август месяц. Если мы случайно не найдем эту квитанцию ​​и точно знаем, что сохранили ее в Dropbox; Мы с уверенностью знаем, что машинное обучение Dropbox проиндексирует содержимое этой фотографии, и информация будет показана нам всего через несколько секунд.


Следуйте за нами в Новостях Google

Оставьте свой комментарий

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

*

*

  1. Ответственный за данные: AB Internet Networks 2008 SL
  2. Назначение данных: контроль спама, управление комментариями.
  3. Легитимация: ваше согласие
  4. Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
  5. Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
  6. Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.