pdf indexado

  • Iniciador del tema Iniciador del tema Anonymous
  • Fecha de inicio Fecha de inicio
A

Anonymous

Guest
hola como estan?
Necsito saber que es un pdf indexado, y como puedo crear uno, si alguien me puede ayudar escribanme un correo a melirb@gmail.com.

Gracias
 
no se trata de ningún nuevo formato de pdf, un pdf indexado se refiere a un pdf que ha sido indexado/guardado/almacenado en un sistema de búsqueda como Autonomy o Ultraseek, si luego en un buscador bajo el sistema que tuvieses buscases ese documento como si una busqueda en google se tratase, encontrarás ese pdf, dándote la url hacia el. Es un tema engorroso pero espero que te haya quedado algo más claro.
O igual te están pidiendo que le metas metadatos al pdf para luego indexarlo/indizarlo y buscarlo más facilmente...???
 
No se si viene mucho al caso, pero yo indexo los PDF con PDFBox y Lucene gestor del Indice, solucion 100% java.

Esta indexacion no se da por metas, si no se indexa el texto completo (bueno menos palabras de parada e insignificantes).
 
Un PDF indexado, realmente no es nada, sino que cuando tu integras un documentos PDF dentro de un gestor documental tal como Alfresco, este gestor busca los metadatos de este documento, y a través de estos datos es cuando crea la indexación, para poder localizar ese documento.
Cuando tu haces una busqueda en el gestor, sobre cualquier texto que aparece dentro del PDF, este te devuelve el documento.
 
Atrás
Arriba