domingo, 15 de mayo de 2011

Organice sus PDF

En mi biblioteca tengo una gran cantidad de libros de variada índole; cada tanto, me deshago de alguno e incorporo otro más. La facilidad para encontrar los libros en bibliotecas y estantes, radica en su presencia física; los tamaños, colores y texturas me dan un adelanto del conocido tomo. Luego, el título confirma o desmiente esa predicción.

      

¿Pero qué ocurre con los PDF que en mi disco se han reproducido hasta llegar a ser miles?

Esa es otra historia, algunos se encuentran escondidos en remotas carpetas del disco, distribuidos erráticamente, muchos están bajo carpetas temáticas, pero no ofrecen pistas claras de su contenido.

Por esta razón, decidí catalogarlos y obtener una pequeña imagen “thumbnail” de escasos KBytes como ilustración. De esta forma, cuando busco un tema específico, miro en una tabla de MySQL (que bien podría ser de Access, DBF o simplemente un archivo de Excel), veo las “tapas” y encuentro la ubicación en el disco en forma instantánea. También, me permite obtener datos bibliográficos para documentar algún trabajo.

Fundamental : que la tarea fuera breve y sencilla (logré hacerlo en menos tiempo que el que me tomó escribir esta nota).

Para realizar este catálogo conseguí tres programas muy pequeños pero realmente prácticos:

Pdftk.exe
PDF2Img.exe
EasyImageModifier.exe


El Pdftk.exe es realmente poderoso ya que además de ejecutarse bajo Windows, también ofrece una forma automatizada desde la línea de comandos de DOS.

El PDF2Img es uno de los pocos programas gratuitos que permiten convertir en formato gráfico las imágenes contenidas en archivos pdf.

El EasyImageModifier permite modificar las características del archivo (en mi caso, achicar las “tapas”).

Todos estos programas trabajan por volúmen, es decir que aceptan grandes cantidades de archivos para procesar. Además, no requieren de interacción, por lo que, una vez lanzados, el usuario queda libre para realizar sus actividades habituales.

Procedimiento

El primer paso fue lanzar el pdftk desde la ventana de DOS y el directorio principal bajo el que cuelgan los archivos PDF



Este programa permite realizar una gran variedad de manipulaciones sobre los archivos PDF, con la opción que utilicé, "cat 1 output" genera archivos PDF cuyo contenido es la página 1, es decir "la tapa".

El programa hizo lo suyo...

Acto seguido, convertí los PDF en JPG por medio del programa PDF2Img.exe, esta tarea se simplificó debido a que le indiqué al Pdftk que agregara “Pag1” al nombre de archivo, de manera que realicé una búsqueda de los PDF que comenzaban con la cadena "Pag1", con el empleo de expresiones regulares convencionales, es decir, “pag1*.pdf”.

Moví todos los archivos a una carpeta temporaria, abrí el PDF2Img.exe y seleccioné la opción “File/Import directory”, Luego “Edit/Start Convert”, dejé que el programa hiciera su trabajo mientras me tomaba un café y respondí algunos mails.

Este programa genera una carpeta cuyo nombre es el que tenía el archivo PDF mas el nombre “-000.jpg”.

Para armar el catálogo generé un archivo (que contiene la localización de los documentos en el disco), por medio del siguiente comando en la ventana de DOS



De ese modo generé el archivo pp cuyo contenido era algo como esto:



Luego armé un programita en Visual Basic (el lector puede emplear VBA, Javascript o incluso un batch de comandos DOS, lo que le resulte más rápido) con un código similar al siguiente:



Esto asigna el nombre que tenía originalmente el PDF a las imagenes JPG y las coloca en una carpeta, en este caso, la carpeta local del proyecto Visual Basic. Los archivos JPG serán grandes, al 70% de la resolución del PDF original, esta es la opción por defecto que puede modificarse a gusto. En mi caso decidí conservar las tapas “grandes” para algún propósito futuro y las almacené en un archivo RAR.

Como último paso, con el EasyImage, levanté todas la imágenes y las convertí al 10%, con lo cual quedaron realmente pequeñas.

Con mis PDF catalogados me despido hasta la próxima,

Sergio Otaño

0 comentarios: