Evernote から Joplin へ移行
遅まきながら Evernote から Joplin へ移行メモ
Upnote と最後まで迷いましたが、Upnoteは下記の要因で見送り
- ノートブック共有がない(ノート単位の共有あり)
- OCRがない
- 画像(1MB以上)の解像度が下げられる
Joplin について
- Markdown(MD)の傾向が強い → HTMLメインの設定あり
- アプリケーション(オープンソースで無料)とストレージが分離されていて、ストレージに Joplin Cloud の他 Dropbox や OneDrive (Google DriveはNG) や Joplin Server(自前サーバ) が利用可能
Joplinの収入は主に Joplin Cloudって事になります
※共有機能を利用するには Joplin Cloud か Joplin Server を要利用 - pdf内の検索 ※古い記事にはpdf検索が無い記載あり
テキストを含むpdfは検索対象、画像はOCRを有効にすれば認識だがOCRの問題点は含まれる - OCR機能(画像、pdf)は後から追加されており ※古い記事にはOCRが無い記載あり
PC版の設定から有効にできる(要PC - 同期クライアントに一つ以上PCがいればよい)
ただし! 日本語についてはOCR結果を見ると分かち書きになっていて、文字の間に全てスペースが入っている(何だよそれ)、なのでOCRテキストは「日 本 語」みたいにスペースを入れるとヒットしたりする → 利用しているライブラリ(tesseract)の影響 - 検索やOCR等、負荷の大きい作業はローカルで行われる、つまりインデックスのsqliteが存在する(スマホは負担有り?) → ストレージが自由なのはそういう事
- スマホで編集可能なのは実質MDノートのみ、HTMLノートは編集がタグ(爆)
Evernote(enex)からのインポート
(テストパターンを作って取り込んでみた結果)
enex からのインポートは「Markdown(MD)」と「HTML」の2パターン
MDの場合かなり書式が失われるため、一旦HTMLで取り込んでおいて、可能なものは HTML→MD 変換をあとからすればOK~ と思っていたが HTML→ MD変換はノートが新規作成となって作成日、更新日、共に変換した日時に変わってしまう(ガーン)
→ 面倒だけど一部のノートブックは enexファイルの名前(ノートブック名)を取り込み時に変更して、HTML形式とMD形式の両方で取り込み、それぞれ必要なのを残して統合しました
HTML形式で取り込んだノートは、上部に「MDへコンバートする?」みたいなバナーが出る
※HTML→MDすると、元のHTMLはゴミ箱に移動する
取り込み時は、無用なエラーや競合を避けるため
- OCRをオフ
- 同期を無効
は必須、ただし同期はインポートしたノートを表示した時点で始まってしまうので、同期が完了するまで次のインポートは待つ
OCRはデータ量によって、ものすごく時間がかかる(タスクマネージャーでCPU消費量から判断)
HTML形式インポート のなんだかな
- HTML形式では pdf のインラインプレビューが行われない(evernoteのスマホみたいな感じ) なので、pdf とコメントだけみたいなのは、取り込み後にMD変換
- 背景が白
アプリケーションのテーマをダークにしていると、ノート部分だけ白、CSSをいじってもダメでした、ライトテーマだと気づかないかも(口笛)
マークダウンを表に出さない設定
デフォルトで「MDエディタ + プレビュー」になっています
これを「プレビュー」のみにすれば、「プレビュー」⇔「HTMLエディタ」となります
Enter は <p>、Shift + Enter は <br/> です(Evernote は <div>と<br/>)
設定のスタイルシートで
/* For styling the rendered Markdown */
p {
margin-block-start: 0.3em;
margin-block-end: 0em;
}
上記CSSでの Evernoteとの比較
ノートブック共有を使用する前提なので、この2つ
Evernoteでの容量が30GBを超えているため、Joplin Cloud の Basic(2GB)や Pro(30GB)では足りず、Team(50GB)となると年契約でも 6.69ユーロ=1,200円/月 となるため、VPSか自前サーバになるかと (Joplin Cloud のストレージ小さくないかい)
サーバ本体とストレージ諸々揃えたら、安いvpsでも変わらない計算に
ひとまず vpsを月契約で借りて試験運用(エンドツーエンド暗号をオンにして)
エンドツーエンド暗号しつつ、共有ノートブックを利用ってどうなんだろうと思っていたが、すべてのユーザーが暗号化を利用する必要がある(これは特に問題ではない)
そして、共有ユーザーの公開鍵を用いて暗号化する(復号化できるのはそのユーザーのみ)んだそうです
移行後の同期
- データは、ノート 約36,000、リソース 約42,000、enexでのデータ量 約45GB
- エンドツーエンド暗号を有効化
→ ローカルの resources フォルダに .crypted というファイルがリソースファイルと共に作られる → 暗号化+リソースを全て取得する場合、リソース×2倍より少し大きい容量が必要となる - インポートしたPCからサーバへのアップロードは12時間程度で完了
- アップロード後のサーバ使用量は 70GBくらいになっていた(元データの倍くらい用意しておいたほうがよいのかも)
- 他PCへの同期(添付ファイルのダウンロード=自動 なのでノートとインデックスのみ)に、4時間程度
- スマホへの同期、画面が開いてないと同期しないのか、ものすごく時間がかかる、その間にスマホで変更したノートは同期の最後に置かれるのか、ずっと同期されない ←いまここ
- インポートPCでOCRをオンにする(CPU使用率高)、リソース数からの進み具合を計算すると10日くらいかかる計算 ←いまここ
コメント