LinuxでWebページをPDFファイルまたは画像に変換する方法

LinuxでWebページをPDFファイルまたは画像に変換する方法

ターミナルを使用してWebページをキャプチャし、PDFドキュメントまたは画像として保存する方法を知りたいですか?幸い、Linuxには、HTMLドキュメントをPDFファイルや画像に変換するタスクを自動化するために使用できるユーティリティが多数あります。





この記事では、作業を簡単にするために必要なユーティリティであるwkhtmltopdfとwkhtmltoimageを紹介します。





HTMLをPDFに変換する方法

WebページをキャプチャしてPDFファイルに変換する場合は、wkhtmltopdfユーティリティが役立ちます。 Wkhtmltopdfは、WebページをPDFドキュメントにレンダリングするために使用されるオープンソースのコマンドラインツールです。





このツールはLinuxターミナル内でヘッドレスで動作するため、WebドライバーやSeleniumのようなブラウザー自動化フレームワークは必要ありません。

Linuxにwkhtmltopdfをインストールする

Wkhtmltopdfは、Linuxにプリインストールされている標準パッケージの1つではありません。システムのパッケージマネージャーを使用して手動でインストールする必要があります。



UbuntuおよびDebianベースのディストリビューションにwkhtmltopdfをインストールするには:

sudo apt install wkhtmltopdf

Manjaro LinuxのようなArchベースのディストリビューションの場合:





sudo pacman -S wkhtmltopdf

FedoraやCentOSなどのRHELベースのディストリビューションにwkhtmltopdfをインストールするのも簡単です。

sudo dnf install wkhtmltopdf

基本構文

コマンドの基本的な構文は次のとおりです。





wkhtmltopdf webpage filename

...どこ ウェブページ 変換するWebページのURLであり、 ファイル名 出力PDFファイルの名前です。

GoogleホームページをPDFドキュメントに変換するには:

wkhtmltopdf https://google.com google.pdf

出力:

PDFファイルを開くと、wkhtmltopdfがWebページを正確にドキュメントにレンダリングしていることがわかります。

NS -コピー 出力ファイルにWebページの複数のコピーを持たせたい場合、flagは命の恩人です。複数のコピーを印刷する場合、wkhtmltopdfは複数のPDFファイルを生成しませんが、代わりに1つのドキュメントにページを追加することに注意してください。

Googleホームページのコピーを3つ作成するには:

wkhtmltopdf --copies 3 https://google.com google.pdf

出力PDFファイルには、前述のコマンドで指定された3ページが含まれます。

出力にグレースケールフィルターを追加する

PDFファイルにグレースケールフィルターを追加するには、 -NS また -グレースケール コマンドでフラグを立てます:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --grayscale https://google.com google.pdf

出力ファイル:

PDFの向きを変更する

デフォルトでは、wkhtmltopdfは縦向きのレイアウト(縦向き)でPDFファイルを生成します。このデフォルトの動作を変更し、代わりに横向きでWebページをキャプチャするには、 - オリエンテーション コマンドでフラグを立てます:

wkhtmltopdf --orientation landscape https://google.com google.pdf

出力:

横向きのドキュメントは、縦向きのドキュメントに比べて空白の領域が大きいことに注意してください。

変換中に画像を含めないでください

出力の生成中に、wkhtmltopdfでWebページに存在する画像をレンダリングしたくない場合は、 -画像なし 国旗:

wkhtmltopdf --no-images https://google.com google.pdf

出力:

関連している: どこでもPDFファイルを編集するための最良のツール

Webページを画像に変換する方法

wkhtmltoimageユーティリティは、wkhtmltopdfパッケージの一部です。レポートに取り組んでいて、Webサイトの画像を含めたい場合は、このツールが役立ちます。 Linuxターミナルでは、画像のキャプチャが簡単になるだけでなく、出力をカスタマイズできるさまざまなオプションも提供されます。

Macでメッセージを削除する方法

基本構文

Wkhtmltoimageの構文はwkhtmltopdfに似ています。

wkhtmltoimage webpage filename

...どこ ウェブページ ウェブサイトのURLであり、 ファイル名 出力画像の名前です。

Webページを画像に変換する

前述の例を続けて、Googleホームページを画像に変換してみましょう。

wkhtmltoimage https://google.com google.png

出力:

出力画像に含めるカスタムファイル形式を指定することもできます。 Wkhtmltoimageは、次のファイル拡張子をサポートしています。

  • JPEG / JPG
  • PNG
  • SVG

たとえば、JPG画像を生成する場合は、次のコマンドでファイル拡張子をJPGに置き換えるだけです。

wkhtmltoimage https://google.com google.jpg

関連している: JPGとJPEG:これらの画像ファイル形式の違いは何ですか?

Linuxターミナルを使用したWebページのキャプチャ

wkhtmltopdfによって生成されたPDFファイルを表示する場合は、LinuxシステムにPDFビューアがインストールされている必要があります。ほとんどのLinuxディストリビューションにはPDFエディターがプリインストールされていますが、ニーズに合ったPDFエディターを手動で選択してインストールできます。

共有 共有 つぶやき Eメール あなたが試すべき5つの最高のLinuxPDFエディター

LinuxでPDFファイルを編集する必要がありますか?これらのLinuxPDFエディターは無料でインストールでき、使いやすいです。

次を読む
関連トピック
  • Linux
  • PDF
  • Linux
著者について ディーペッシュシャルマ(79件の記事が公開されました)

Deepeshは、MUOのLinuxのジュニアエディターです。彼はLinuxに関する情報ガイドを作成し、すべての新規参入者に至福の体験を提供することを目指しています。映画についてはよくわかりませんが、テクノロジーについて話したいのなら、彼はあなたの男です。余暇には、本を読んだり、さまざまな音楽ジャンルを聴いたり、ギターを弾いたりしています。

DeepeshSharmaのその他の記事

ニュースレターを購読する

ニュースレターに参加して、技術的なヒント、レビュー、無料の電子書籍、限定セールを入手してください。

購読するにはここをクリックしてください