Dropbox는 PDF 텍스트 및 이미지에서 콘텐츠를 찾기 위해«머신 러닝»을 개선했습니다.

라스 스토리지 클라우드 그들은 완벽을 향한 사명을 완수합니다. 그러나 누가 더 나은 서비스를 제공하는지에 대한 논쟁은 점점 더 높아지고 있습니다. 이 회사의 목표는 나머지에서 기술적으로 눈에 띄다 다른 플랫폼에서 제공하지 않는 도구를 제공합니다.

Dropbox의 경우입니다. 지난달 전체 플랫폼에 머신 러닝을 도입했습니다. 그러므로 우리는 텍스트를 검색 할 수 있습니다 클라우드에 업로드 된 콘텐츠의 대부분을 인덱싱하는 기술을 통해 PDF 또는 이미지에서. 바로 오늘 그들은 방금 발표했습니다 이 기술을 개선하는 조치, 그 어느 때보 다 잘 작동 할 것으로 예상됩니다.

프리미엄 사용자를위한 머신 러닝과 같은 프리미엄 기능

머신 러닝의 목표는 인공 지능 자체가 사용자 생산성을 향상시키는 기능을 수행 할 수 있도록하는 것입니다. Dropbox의 경우이 "머신 러닝"을 통해 사용자는 불가능한 문서 검색 이미지처럼 색인을 생성 할 수 없기 때문입니다. 이 기술은 머신 러닝과 광학 문자 인식 (OCR)을 기반으로합니다.

OCR은 이미지에서 특정 알파벳에 속하는 기호 나 문자를 자동으로 식별하여 데이터로 저장하는 텍스트를 디지털화하는 것을 목표로하는 프로세스입니다.

사용자 이제 Dropbox의 "프리미엄"플랜에 가입하면이 도구를 사용할 수 있습니다. 메커니즘은 간단합니다. 클라우드 검색 엔진에 무언가를 입력하면 검색어와 일치하는 거의 모든 문서를 찾을 수 있습니다. 이 모든 문제는 이미지 형식이 텍스트 콘텐츠가 없기 때문에 인덱싱 할 수 없다는 것입니다. 반면 TXT, HTML 또는 DOCX 확장자를 가진 파일은 텍스트 자체이기 때문에 인식하기가 더 쉽습니다.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

이 도구의 유용성은 무한합니다. XNUMX 월의 전기 요금 사진을 찍는다고 상상해보십시오. 혹시라도 영수증을 찾지 못했고 Dropbox에 저장했음을 확신하는 경우 Dropbox의 기계 학습이 해당 사진의 콘텐츠를 인덱싱하고 정보가 단 몇 초 안에 표시 될 것임을 확실히 알고 있습니다.


Google 뉴스에서 팔로우

코멘트를 첫번째로 올려

코멘트를 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

*

*

  1. 데이터 책임자: AB Internet Networks 2008 SL
  2. 데이터의 목적 : 스팸 제어, 댓글 관리.
  3. 합법성 : 귀하의 동의
  4. 데이터 전달 : 법적 의무에 의한 경우를 제외하고 데이터는 제 XNUMX 자에게 전달되지 않습니다.
  5. 데이터 저장소 : Occentus Networks (EU)에서 호스팅하는 데이터베이스
  6. 권리 : 귀하는 언제든지 귀하의 정보를 제한, 복구 및 삭제할 수 있습니다.