PDF тексттеринде жана сүрөттөрүндө камтылгандарды табуу үчүн Dropbox «машиналык окутууну» өркүндөтөт

The сактоочу булуттар алар өз миссиясын кемчиликсиздик менен аткарышат. Бирок, ким жакшыраак кызмат сунуш кылат деген талаш улам-улам күчөп баратат. Бул компаниялардын максаты болуп саналат технологиялык жактан башкалардан өзгөчөлөнүп турат башка платформалар сунуштабаган шаймандарды сунуштоо.

Бул Dropboxтун иши. Өткөн айда ал бардык платформасында машина окутууну киргизди. Ошентип биз текст издей алабыз булутка жүктөлгөн мазмунунун көп бөлүгүн индексациялоону башкарган технология аркылуу PDF же сүрөттөрдө. Бүгүн эле алар жаңы эле жарыялашты бул технологияны өркүндөтүүчү чаралар, жана ал мурдагыдан да жакшы иштеши күтүлүүдө.

Премиум колдонуучулар үчүн машиналык окутуу сыяктуу премиум функциялары

Машиналык окутуунун максаты - жасалма интеллекттин өзүн колдонуучунун өндүрүмдүүлүгүн жогорулатуучу функцияларды аткарууга жөндөмдүү кылуу. Dropbox жөнүндө айта турган болсок, бул "машина менен окутуу" колдонуучуларга мүмкүнчүлүк берет мүмкүн болбогон документтер аркылуу издөө анткени алар сүрөттөр сыяктуу индекстелбейт. Бул технология машинаны үйрөнүүгө жана, албетте, Оптикалык символдорду таанууга (OCR) негизделген.

OCR - бул текстти санариптештирүүгө багытталган, белгилүү бир алфавитке таандык белгилерди же белгилерди сүрөттөн автоматтык түрдө аныктап, андан кийин аларды маалымат катары сактоого багытталган процесс.

Колдонуучулар менен Dropboxтун көбүрөөк "премиум" пландарына жазылуулар эми ушул куралды колдоно алат. Механикасы жөнөкөй: булут издөө тутумуна бир нерсе киргизсеңиз, анда издөө терминине дал келген документтердин бардыгы табылат. Мунун баарынын көйгөйү, сүрөттүн форматтары индекстелбейт, анткени аларда тексттин мазмуну жок. Экинчи жагынан, TXT, HTML же DOCX кеңейтүүлөрү бар файлдарды таанып билүү оңой, анткени алар өздөрү тексттер.

El beneficio potencial de reconocer automáticamente el texto en las imágenes (incluidos los archivos PDF que contienen imágenes) es tremendo. Las personas han almacenado más de 20 mil millones de imágenes y archivos PDF en Dropbox. De esos archivos, 10-20% son fotos de documentos, como recibos e imágenes de pizarra, en lugar de los documentos en sí. Estos son ahora candidatos para el reconocimiento automático de texto de imagen. Del mismo modo, el 25% de estos PDF son escaneados de documentos que también son candidatos para el reconocimiento automático de texto.

Бул инструменттин ыңгайлуулугу чексиз. Август айында электр энергиясына болгон төлөмдү сүрөткө тартып жатабыз деп элестетип көрсөңүз. Эгер биз ошол дүмүрчөктү кокустан таппасак жана аны Dropboxко сактагандыгыбызды билсек; Dropboxтун машиналык окутуусу ошол сүрөттүн мазмунун индекстеп, маалымат бир нече секунданын ичинде бизге көрсөтүлөрүн биз билебиз.


Макаланын мазмуну биздин принциптерге карманат редакциялык этика. Ката жөнүндө кабарлоо үчүн чыкылдатыңыз бул жерде.

Комментарий биринчи болуп

Комментарий калтырыңыз

Сиздин электрондук почта дареги жарыяланбайт. Милдеттүү талаалар менен белгиленет *

*

*

  1. Маалыматтар үчүн жооптуу: Мигель Анхель Гатан
  2. Маалыматтын максаты: СПАМды көзөмөлдөө, комментарийлерди башкаруу.
  3. Мыйзамдуулук: Сиздин макулдугуңуз
  4. Маалыматтарды берүү: Маалыматтар үчүнчү жактарга юридикалык милдеттенмелерден тышкары билдирилбейт.
  5. Маалыматтарды сактоо: Occentus Networks (ЕС) тарабынан уюштурулган маалыматтар базасы
  6. Укуктар: Каалаган убакта маалыматыңызды чектеп, калыбына келтирип жана жок кыла аласыз.