ここ数カ月、Obsidianを試しています。その中でブラウザの拡張機能としてWeb Clipperがあり、テンプレートや変数を使うことで、取得する情報がいろいろカスタマイズできるようです。「見たまま」を記録することができず、画像がローカルに保存されないなど、ちょっと癖がありますが、カスタマイズ性は良さそうです。
PDFファイルを直接ダウンロード
最初に気になったのが、ブラウザでPDFを開いてWeb Clipperで保存しようとするとURLが保存されるだけという点。

これは不自由なので、早速勉強のためにカスタマイズしてみようと思います。
まずは拡張機能のWeb Clipperのオプションを表示し、[テンプレート]で新規テンプレートを追加します。

もともとある「デフォルト」テンプレートを複製してもいいでしょう。

- [テンプレート名]:適宜
- [ノート名]:変数が利用できます。これはObsidianのヘルプを参考に設定しました。PDFだとタイトルなどが取得できないため、保存時の日付を設定し、PDFであることを示しています。
- [ノートの場所]:クリップした保存先。「Clippings」はデフォルトフォルダ。これも適宜。
- [保管庫]:デフォルトの保管庫。これも適宜。
- [テンプレートトリガー]:このテンプレートを自動で適用するか否か。これはURLの最後が「.pdf」の場合に呼び出されるようにしています。

- [プロパティ]:これはデフォルトのままです。PDFなので取得できる情報は多くはなく、まあ、適当に設定していいでしょう。
- [ノートの内容]:これはURLをそのまま貼り付けています。

PDFのURLが取り込めました。後は[Obsidianに追加]を押します。

取り込まれましたが、これだとオンラインにアクセスしているだけで、ローカルには保存されていません。自動でダウンロードしてほしいところ。
というわけでもう一工夫。今度はコミュニティプラグインを導入します。Obsidianはプラグインで機能拡張できるのも便利なところ。詳細は省きますが、「Local image plus」プラグインを利用します。


あんまりちゃんと設定は検証してませんが、一応、この設定にしておきます。重要なのは[Automatic Processing]でしょうか。これで、「Web ClipperでPDFを取り込むと、ノート内のPDFのURLから自動でファイルをダウンロードして指定フォルダに保存する」という動作が自動化できました。
Local image plusがちゃんと動作しない場合があって、この辺は理由が不明ですが、期待通りの状況になりました。
国立国会図書館デジタルコレクションをクリップ
さて、PDFのダウンロードはそれほど難しくはありませんでしたが、国立国会図書館デジタルコレクションはちょっと手間がかかりました。単に[プロパティ]の取得が面倒というのが一番の理由でした。このあたり生成AIとか使えばもっと簡単だったんでしょうか。

こちらに関しては特に特別な設定はしていません。[テンプレートトリガー]として国立国会図書館デジタルコレクションのURLである https://dl.ndl.go.jp/ を設定してあります。

[プロパティ]は国立国会図書館デジタルコレクションに合わせました。データはほかにも色々あるのですが、取りあえず主要そうなものをピックアップしました。
[ノートの内容]は、なかなかうまく取得できなかったのですが、Markdownに変換する変数にしたところ、ひとまず満足できるような印象でした。

例えばこの書籍を取り込んでみると、以下のようになりました。



データとしては使えそうな印象です。本当は書籍の画像も取り込みたいのですが、さすがに問題があるので、ある程度内容が取り込めればいいでしょう。
Obsidian Web Clipperのテンプレートは、JSONでのエクスポートが可能なので、一応出力した物を置いておきます。自由にカスタマイズしてください。

