wkhtmltopdf è uno strumento da riga di comando open source che può salvare pagine web come PDF o immagine
SingleFile, il suo fork SingleFileZ e Save Page WE sono eccellenti opzioni per salvare intere pagine web come una singola pagina HTML. Ma a volte, potresti volere che la pagina web sia facilmente accessibile. Ad esempio, potresti voler avere i tuoi materiali di studio, documenti di ricerca sul tuo telefono e computer. La conversione dell’HTML in un PDF è un buon modo per garantire la compatibilità tra dispositivi,
Wkhtmltopdf è uno strumento open source e multipiattaforma in grado di convertire pagine HTML in PDF. Questa è un’utilità della riga di comando, ma non preoccuparti, è abbastanza facile da usare.
Installa l’applicazione o estrai l’archivio portatile in una cartella. Apri una finestra del prompt dei comandi.
La sintassi per l’utilizzo dello strumento è abbastanza semplice, inserisci il nome wkhtmltopdf, seguito dall’URL della pagina web e il nome del PDF che vuoi creare, in questo modo.
wkhtmltopdf URL nomefile.pdf
Supponiamo che tu voglia salvare una copia di un sito web, questo è l’aspetto che avrà il comando.
wkhtmltopdf https://www.example.com/page example.pdf
Non era difficile adesso, vero? Ma consiglierei di usare un comando leggermente diverso.
wkhtmltopdf -n https://www.example.com/page example.pdf
L’unica differenza qui è l’opzione -n, che disabilita il caricamento di Javascript. Inoltre accelera il processo di creazione del PDF. Puoi anche usare –disable-javascript per lo stesso effetto, ma usare -n è molto più semplice. Se una pagina ha molti script, il processo di conversione potrebbe bloccarsi e talvolta anche l’aspetto del file di output potrebbe risentirne, ma se desideri un’elaborazione rapida, -n è l’opzione migliore. È possibile eseguirlo senza il parametro se l’output è confuso.
Quando il comando viene passato al programma, carica la pagina web in background (senza aprire il browser) e inizia il processo di conversione. Questa operazione potrebbe richiedere uno o due minuti a seconda del contenuto della pagina web, ma non richiede alcuna interazione. Quindi, aspetta solo che venga completato e il tuo PDF sia pronto per l’uso. wkhtmltopdf salva il PDF nella propria cartella. Dovresti prestare attenzione al nome del PDF che stai utilizzando, perché il programma sovrascriverà qualsiasi file esistente nella cartella senza avvisarti.
Ecco uno screenshot di una pagina web aperta in Firefox.
Usiamo lo strumento. wkhtmltopdf https://en.wikipedia.org/wiki/Computer wiki.pdf
Ed ecco come appare la versione PDF (creata usando wkhtmltopdf).
Come puoi vedere dall’immagine, wkhtmltopdf ha estratto perfettamente la pagina. Conserva anche i collegamenti nelle pagine.
Ci sono un sacco di altre opzioni che puoi usare, puoi visualizzarle usando il comando di aiuto integrato.
wkhtmltopdf -h
Se desideri solo il testo dalla pagina web, puoi aggiungere –no-images al comando. Non vuoi includere link (ad altre pagine)? Usa –disable-internal-links
E se quello che vuoi salvare il file HTML come immagine? Perché no, puoi farlo con l’aiuto di wkhtmltoimage. Questa utility è inclusa come parte del pacchetto wkhtmltox. Puoi usare gli stessi comandi che hai usato per il PDF, con lo strumento immagine.
wkhtmltoimage https://en.wikipedia.org/wiki/Computer wiki.jpg
Supporta anche altri formati di immagine come PNG, BMP, ma questi finiscono per avere dimensioni di file molto grandi (100+ MB), JPG ha il miglior livello di compressione.
Wkhtmltopdf e wkhtmltoimage sono disponibili per Windows, Mac, Linux. Lo strumento è disponibile in versioni portatili per sistemi a 32 bit e 64 bit.