Cómo convertir una página web a un archivo PDF o imágenes en Linux

Cómo convertir una página web a un archivo PDF o imágenes en Linux

¿Quiere saber cómo puede capturar una página web y guardarla como un documento PDF o una imagen usando el terminal? Afortunadamente, Linux tiene una gran cantidad de utilidades que puede utilizar para automatizar la tarea de convertir documentos HTML a archivos e imágenes PDF.





Este artículo le presentará wkhtmltopdf y wkhtmltoimage, utilidades que necesita para facilitar su trabajo.





Cómo convertir HTML a PDF

Si está buscando capturar páginas web y convertirlas en un archivo PDF, la utilidad wkhtmltopdf lo ayudará. Wkhtmltopdf es una herramienta de línea de comandos de código abierto que se utiliza para convertir páginas web en documentos PDF.





Dado que la herramienta funciona sin cabeza dentro de la terminal de Linux, no necesitará ningún controlador web o un marco de automatización del navegador como Selenium.

Instalar wkhtmltopdf en Linux

Wkhtmltopdf no es uno de los paquetes estándar que vienen preinstalados en Linux. Tendrá que instalarlo manualmente utilizando el administrador de paquetes de su sistema.



Para instalar wkhtmltopdf en distribuciones basadas en Ubuntu y Debian:

|_+_|

En distribuciones basadas en Arch como Manjaro Linux:





|_+_|

La instalación de wkhtmltopdf en distribuciones basadas en RHEL como Fedora y CentOS también es fácil.

|_+_|

Sintaxis básica

La sintaxis básica del comando es:





|_+_|

...dónde Página web es la URL de la página web que desea convertir y nombre del archivo es el nombre del archivo PDF de salida.

Para convertir la página de inicio de Google en un documento PDF:

|_+_|

Producción:

Al abrir el archivo PDF, notará que wkhtmltopdf ha convertido con precisión la página web en un documento.

los --copias flag es un salvavidas si desea que su archivo de salida tenga varias copias de la página web. Tenga en cuenta que al imprimir varias copias, wkhtmltopdf no generará varios archivos PDF, sino que agregará páginas adicionales a un solo documento.

Para crear tres copias de la página de inicio de Google:

|_+_|

El archivo PDF de salida contendrá tres páginas como se especifica en el comando mencionado anteriormente.

Agregar un filtro de escala de grises a la salida

Para agregar un filtro de escala de grises al archivo PDF, use el -gramo o --escala de grises bandera con el comando:

|_+_|

Archivo de salida:

Cambiar la orientación del PDF

De forma predeterminada, wkhtmltopdf genera el archivo PDF en formato vertical, es decir, retrato. Para cambiar este comportamiento predeterminado y capturar páginas web en formato horizontal, utilice el --orientación bandera con el comando:

|_+_|

Producción:

Tenga en cuenta que la versión horizontal del documento tiene un área de espacios en blanco más grande en comparación con la versión vertical.

No incluya imágenes durante la conversión

Mientras genera la salida, si no desea que wkhtmltopdf represente imágenes presentes en una página web, use el --Sin imágenes bandera:

|_+_|

Producción:

Relacionado: Las mejores herramientas para editar un archivo PDF en cualquier lugar

Cómo convertir una página web en imágenes

La utilidad wkhtmltoimage es parte del paquete wkhtmltopdf. Si está trabajando en un informe y desea incluir imágenes de un sitio web, esta herramienta funcionará a su favor. La terminal de Linux no solo le facilita la captura de imágenes, sino que también le brinda una variedad de opciones que le permiten personalizar su salida.

cómo arreglar el uso de 100 discos

Sintaxis básica

Wkhtmltoimage tiene una sintaxis similar a wkhtmltopdf:

|_+_|

...dónde Página web es la URL de un sitio web y nombre del archivo es el nombre de la imagen de salida.

Convertir una página web en una imagen

Continuando con el ejemplo antes mencionado, convierta la página de inicio de Google en imágenes.

|_+_|

Producción:

También puede especificar un formato de archivo personalizado que desee que tenga la imagen de salida. Wkhtmltoimage admite las siguientes extensiones de archivo:

  • JPEG / JPG
  • PNG
  • SVG

Por ejemplo, si desea generar una imagen JPG, simplemente reemplace la extensión del archivo con JPG en el comando:

|_+_|

Relacionado: JPG vs JPEG: ¿Cuál es la diferencia entre estos formatos de archivo de imagen?

Captura de páginas web con la terminal de Linux

Debe tener un visor de PDF instalado en su sistema Linux si desea ver los archivos PDF generados por wkhtmltopdf. Si bien la mayoría de las distribuciones de Linux vienen con un editor de PDF preinstalado, puede elegir e instalar manualmente un editor de PDF que se adapte a sus necesidades.

Cuota Cuota Pío Correo electrónico Los 5 mejores editores de PDF para Linux que debes probar

¿Necesita editar un archivo PDF en Linux? Estos editores de PDF de Linux son de instalación gratuita y fáciles de usar.

Leer siguiente
Temas relacionados
  • Linux
  • PDF
  • Linux
Sobre el Autor Sharma profundo(79 Artículos publicados)

Deepesh es el editor junior para Linux en MUO. Escribe guías informativas sobre Linux, con el objetivo de proporcionar una experiencia maravillosa a todos los recién llegados. No estoy seguro de películas, pero si quieres hablar de tecnología, él es tu chico. En su tiempo libre, puedes encontrarlo leyendo libros, escuchando diferentes géneros musicales o tocando su guitarra.

Más de Deepesh Sharma

Suscríbete a nuestro boletín

¡Únase a nuestro boletín de noticias para obtener consejos técnicos, reseñas, libros electrónicos gratuitos y ofertas exclusivas!

Haga clic aquí para suscribirse