Dropbox改进了其“机器学习”功能,可在PDF文本和图像中查找内容

储存云 他们完成了自己的使命,追求完美。 但是,关于谁提供更好服务的争议越来越大。 这些公司的目标是 在技​​术上与众不同 提供其他平台不提供的工具。

Dropbox就是这种情况。 上个月,它在整个平台上引入了机器学习。 因此 我们可以搜索文字 PDF或图像中的内容,通过一项技术可以对上传到云中的大部分内容建立索引。 就在今天,他们刚刚宣布 改善这项技术的措施, 并且它有望比以往更好地工作。

高级功能,例如面向高级用户的机器学习

机器学习的目标是使人工智能本身能够执行提高用户生产力的功能。 对于Dropbox,这种“机器学习”功能使用户可以 搜索无法搜索的文档 因为它们不能像图像一样被索引。 该技术基于机器学习,当然还基于光学字符识别(OCR)。

OCR是旨在数字化文本的过程,该过程会自动从图像中识别属于某个字母的符号或字符,然后将它们存储为数据。

用户与 现在,订阅Dropbox的更多“高级”计划即可使用此工具。 机制很简单:您在云搜索引擎中键入内容,它将发现几乎所有与搜索词匹配的文档。 所有这些的问题是图像格式不可索引,因为它们本身没有文本内容。 相反,带有TXT,HTML或DOCX扩展名的文件本身就是文本,因此更易于识别。

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

该工具的可用性是无限的。 想象一下,我们为八月份的电费账单拍照。 如果我们没有发现该收据,并且可以肯定我们已经将其存储在Dropbox中; 我们可以肯定地知道,Dropbox的机器学习将索引该照片的内容,并且信息将在几秒钟内显示给我们。


本文内容遵循我们的原则 编辑伦理。 要报告错误,请单击 信息.

成为第一个发表评论

发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责资料:AB Internet Networks 2008 SL
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。