Archivos CHM: Cómo trabajarlos en Linux
Cuántas veces nos ha pasado que necesitamos leer y trabajar sobre archivos CHM en Linux y se nos dificulta? CHM es un formato de bibliografía que principalmente encontraremos en las ayudas de Microsoft, pero que hoy en día se utiliza para distribuir gran cantidad de documentación, papers, libros, etc.
Hoy un pequeño tutorial sobre cómo leer archivos CHM en Linux, y convertir archivos CHM a otros formatos.
Abriendo archivos chm
Para poder abrir un archivo chm podemos utilizar alguna aplicación acorde, por ejemplo, xchm.
En Debian y similares:
aptitude install xchm
Podemos ahora abrir nuestro archivo chm sin ningún problema, ya sea por línea de comandos, o dando clic sobre el archivo en el directorio donde se encuentra almacenado.
Convirtiendo un chm en html
Otra forma interesante para leer archvivos CHM, y más cuando no disponemos de hardware suficiente para recorrer un archivo chm grande, es convertirlo en una serie de archivos html para verlos y trabajarlos!
El primer paso es instalar una biblioteca especial:
aptitude install libchm-bin
Luego, deberemos crear un directorio en nuestro sistema de archivos donde se almacenarán los archivos html generados en base al chm:
mkdir ~/C_Primer_Plus,_5th_Ed
Por último, invocar el comando extract_chmLib pasándole dos argumentos, el archivo chm a extraer, y el directorio donde se extraerá el contenido:
extract_chmLib C_Primer_Plus,_5th_Ed.chm C_Primer_Plus,_5th_Ed/
Veremos una salida similar a esta:
diego@sol:~$ extract_chmLib C_Primer_Plus_5th_Ed.chm C_Primer_Plus_5th_Ed.chm 5th_Ed/ --> /#IDXHDR --> /#ITBITS --> /#STRINGS --> /#SYSTEM --> /#TOPICS --> /#URLSTR --> /#URLTBL --> /#WINDOWS --> /$FIftiMain --> /$OBJINST --> /$WWAssociativeLinks/Property --> /$WWKeywordLinks/Property --> /0672326965.hhc --> /0672326965/app01.html [...]
Por ultimo, si listamos el contenido del directorio generado, veremos algunas cosas interesantes:
diego@sol:~$ ls C_Primer_Plus_5th_Ed 0672326965 $FIftiMain #ITBITS #STRINGS #TOPICS #URLTBL $WWAssociativeLinks 0672326965.hhc #IDXHDR $OBJINST #SYSTEM #URLSTR #WINDOWS $WWKeywordLinks
Hay varios archivos sin importancia, y un directorio cuyo nombre es un número. Dentro del mismo están todos los archivos html generados!
El archivo de portada se llama main.html, y dentro generalmente tendremos un link a la tabla de contenidos (TOC), con la que podremos acceder a todos los capítulos incluidos en el chm original y sus temas!
Otra forma es abrir directamente el archivo toc.html para acceder a la tabla de contenidos del chm, y a leer!!
2 comentarios
CoskiBukowski · 14 mayo, 2015 a las 15:29
Yo uso un plugin para firefox, que permite leer directamente los CHM y te da el arbol de contenidos en una barra lateral. Creo q se llamaba chmfox la extension. Ahora no lo puedo verificar porque la tengo en el laburo.
Saludos
Diego Cordoba · 14 mayo, 2015 a las 15:31
Gracias por el aporte!! Sí, se llama ChmFox el add-on en firefox, aprovecho y paso el link por acá para quien no lo conoce (como yo :P). Saludos!
https://bitbucket.org/zhuoqiang/chmfox
Los comentarios están cerrados.