孤独な社会人の一人遊び
孤独な社会人の日記帳です.

Book scanning

最近コミックを自炊していて気になるのが空白ページの多さ。
雑誌掲載時のページ数とか見開きとかの関係で空白ページを
はさむのはいいのですが、落書き1つ入れずにロゴだけが入った
まったく無駄なページを大量に入れてかさ増ししてるのは
ちょっといただけないなぁ・・・

読んでる時は各話の区切りとなっていたのであまり
気にならなかったのですが、エクスプローラで
サムネ画像を見るとちょっと酷い・・・
book.jpg

まぁ雑誌で買わない自分としては速い間隔で単行本が
出てくれるのはいいのですが、上の画像の例だと1/4は
まったく無駄なページなんですよね。

食品とかでもそうですが、堂々と値上げしますと言っても
別に気にしないのにこそこそ内容量を減らして実質的な
値上げを隠れてやろうとするから印象が悪くなるんだよなぁ・・・

「Cover_Creator」更新

自炊用表紙画像作成ソフトCover_Creator更新のお知らせです。

ダウンロードはこちらから ⇒ Download (v0.1.9.1)
すでに使用されている方はexeファイルのみ上書きしてください。


-- 修正内容 --
Windows7で画面の解像度設定のフォントやその他の項目の大きさを
「大(L)-150%」に設定していると設定画面のAWS情報の一部と保存/
キャンセルボタンが表示されない問題を修正しました。

原因としてはFormのAutoScaleModeを「DPI」に設定していたためで、
設定画面のみ「Font」 に変更しました。

「Cover_Creator」更新のお知らせ

自炊用表紙画像作成ソフトCover_Creator更新のお知らせです。

ダウンロードはこちらから ⇒ Download (v0.1.9.0)
すでに使われている方はexeファイルを上書きし、「tessdata」フォルダ、
「x86」フォルダ、「Tesseract.dll」「Tesseract.xml」をCover_Creator.exeと
同じ場所にコピーしてください。


-- 修正内容 --
・画像からOCRでISBNコードを読み取って書籍情報検索を行えるモードを追加。
ここのところ梱包フィルムにシールでバーコードが貼られている本が
増えてきており、毎回キーワード検索を行うのも面倒なので、画像上の
ISBN文字列をOCRにて読み込んでISBNコード検索を行うモードを追加しました。
OCRのライブラリはtesseract-ocrを使用しています。

マウス選択処理に表紙、バーコードに加えて「ISBN」が追加されているので、
ISBNのラジオボタンを選択してから画像上のISBNコードを含む範囲をマウス
ドラッグで選択してください。
111.jpg
本によっては表紙カバーにバーコードはなくてもISBNコードが文字で書かれている
ものがあるので、その場合はそこを選択します。一連の文字列を一括して選択すると
その中から「ISBN」や「-ハイフン」は自動で削除して13桁のISBNコードだけを抽出
して検索を行いますが、背景の画像がかぶっていたりするとOCRで正しく文字が
認識できず、13桁のISBNコードとして読み取れない場合があります。
よくあるのがISBNの「B」を「8」と間違えるのと、978~の「8」を「B」と間違えるもの。
そこで上図のように"ISBN"を外して数字部分のみをマウスドラッグで選択することで
正しく読み込める場合があります。
222.jpg
また、表紙カバー以外にも本文最終ページには必ずISBNコードが書かれていると
思いますので、そこで選択するのもアリかと思います。


取り込み画質や解像度によってはどうしてもOCRの精度が悪い場合
があるので、OCR認識を数字のみに制限することで正しく読み込める
ようになる可能性があります。
設定画面で「OCRは数値のみ検出」にチェックを入れると、数値とハイフンのみを
優先して認識するようになるため、この状態でISBNコードの数値部分のみを
マウスドラッグで選択することでかなりの確率で読み込めるようになると思います。
まぁどうしてもだめなら大人しくキーワード検索を使ってくださいw

・iX500の読取設定切り替え機能でタイミングによって上手く切り替わらなかった問題を修正。
ScanSnap Managerがまだ処理中に切り替えキーを押すと画面上は
カラーモードとグレーモードが切り替わっているように見えているのですが、
実際には切り替わっていないという状況が発生していたので修正しました。
Scan直後のまだManagerが処理している最中に切り替えキーを押すと
Message欄にその旨を表示して切り替えが行われないようになっています。

・Cover_Creatorにフォーカスが無いときにも読取設定切り替えキーが動作するように修正。
これまではCover_Creator自体にフォーカスが無いと読取設定切替キーが
効きませんでしたが、今回から常にキーボードの状態をHookするように
処理を変更したので、他のソフトにフォーカスがあっても読取設定切り替えが
できるようになりました。ただし、他にフォーカスがあると割当キーによっては
他の部分で誤動作が起こる可能性があるので設定画面でのキー設定と実際に
使用する際には十分注意してください。

ということで、今日は修正版ソフトにてデバッグも兼ねて
20冊ほど電子化して約1時間。
流れに乗ってくれば1冊3分以下でできるのですが、
1回躓くとそこでどうしても時間を取られてしまってTotalでは
なかなか時間が短縮できませんね~
糊が残ってて重送しちゃったりごみが入って白線が出て
スキャンし直しとかはなかなか防ぐのがむつかしいので
これ以上時間短縮はやっぱ厳しいのかなぁ・・・

「Cover_Creator」更新のお知らせ

またまた更新です。

ダウンロードはこちらから ⇒ Download (v0.1.8.0)
すでに使われている方はexeファイルのみ上書きでおk。

-- 修正内容 --
指定したページからISBNバーコードを自動探索するモードを追加しました。
設定画面の「バーコード自動探索」にチェックを入れてください。
チェックを入れない場合は今までと全く動作は変わりません。

探索ページの指定は「最初から」または「最後から」ページを指定します。
たとえば表紙カバーを一番最後に読み取る場合は「最後から」「1ページ目」
と指定します。自動探索は、ソフト起動時または「フォルダ再読込」ボタンを
押した際に指定されたページからすべてのバーコードを自動的に探索し、
その中で「987~」で始まる書籍のISBNコードが発見されればその値から
書籍情報を自動検索します。

指定したページにISBNコードが発見できなかった場合はMessage:欄に
バーコードが読み込めなかった旨のメッセージが表示されます。

もちろん今まで通りマウスで範囲を指定してバーコードを読み取らせることも
できるので、自動で探索できなかった場合は表紙選択後、バーコードを手動で
選択してください。

また、最新のCover_Creatorのダウンロードリンクをこのブログ右側のメニュー
欄のプロフィールの下に表示するようにしてみました。
今後は過去記事のダウンロードリンクを更新しませんので、最新版は右側
メニューのリンクからダウンロードしてください。

「Cover_Creator」更新のお知らせ

Cover_Creatorバージョンアップのお知らせ

ダウンロードはこちらから ⇒ Download (v0.1.7.4)

基本的な使い方は変わっていません。 ⇒ 使用方法

すでに使われている方はexeファイルの上書きでおk。

-- 修正内容 --
「ZIP圧縮を行わない(リネーム&画像回転のみ)」モードで、
ScanSnap画像取込フォルダと圧縮ファイル移動先フォルダが
別ドライブにあるとフォルダが移動できない不具合を修正しました。

また、「ZIP圧縮した本の情報をCSVファイルで一覧に残す」にチェックが
入っていない場合でも常にCSVファイルへの情報保存が行われていた
バグを修正しました。

その他、ファイル圧縮完了後に表示されるメッセージボックスは毎回閉じるのが
面倒なため、Message欄に完了報告を表示するように変更しました。



相変わらず仕事でもプログラムは書いているのですが、
.net系ではないため、定期的にC#とかのプログラムも書いてないと
腕が鈍るので何かしらお題を与えてもらえると本業に余裕があるときは
喜んで飛びつきます(´ー`)

ちなみに今回の問題はフォルダ移動に「Directory.Move」を使っていたこと。
こいつはフォルダ移動というよりは名前の変更といった感じの処理で、ドライブが
異なる場所への移動はできないそうです。
なのでFileSystem.MoveDirectoryメソッドを使用して処理するように変更しました。
また一つ勉強になりました(´ー`)

「Cover_Creator」更新のお知らせ

Cover_Creatorバージョンアップのお知らせ

ダウンロードはこちらから ⇒ Download (v0.1.7.4)

ScanSnapのカラー切り替えが現在カラーなのかグレーなのか
遠目では見にくかったので圧縮ボタンの色を変えるようにしてみました。

基本的な使い方は変わっていません。 ⇒ 使用方法

すでに使われている方はexeファイルの上書きでおk。

また、とある方からご要望のあった圧縮せずフォルダ作成と
リネームのみ行うモードというのを追加してみました。
使用するには設定画面から「ZIP圧縮を行わない(リネーム&画像回転のみ)」
にチェックを入れてください。

確かに、圧縮してしまうとビューワ等がないと読めなくなるので
フォルダで管理したいという人なんかは使えるのではないでしょうか。

その他、こうして欲しいという要望やこうやったほうが便利だよという
ご意見等がありましたらお気軽にコメントやメールにてご連絡ください。
気が向いたら対応します(´ー`)

再製本

iX500での自炊ですが、一応漫画だけではなく技術書なんかも
電子化して持ち運んでるのですが、さすがに漫画と違って1冊
数千円する本をScan後すぐに捨ててしまうのは忍びないし、
紙としてもあればそちらの方が見やすい場合も多いので、
なんとか再製本出来ないかと思っていました。

で、一応製本機というものが7000円くらいで売ってはいるものの、
それほど使う頻度は多くないし、わざわざ買うのももったいないなぁ
と思ってたのですが、ちょっと調べてみたら閉じるための専用糊って
シート状のホットメルトなんですね。

じゃあグル―ガンでいいんじゃね?

ということでやってみた。
DSC07848.jpg

DSC07849.jpg

DSC07850.jpg

おー!十分実用的なレベルでくっつくじゃん!
とよろこんでこの記事を書きながらもう少し調べてみたら
すでにいろんな方がやり方を確立されてたんですね。

背表紙にはのこぎりで切れ目を入れて、最後にクッキングシートを
かぶせてアイロンで成形するのが主流なようです。

自分はそこまできれいにやるつもりはないので鋸刃を入れて
グル―を盛るだけでも十分かなと思います。
であればものの15分もあれば1冊製本できるので
技術書関連は再製本して実家や会社に置いて
おきたいと思います(´ー`)

自炊効率化ソフト「Cover_Creator」

Cover_Creatorバージョンアップのお知らせ

ダウンロードはこちらから ⇒ Download (v0.1.7.4)
※2015/02/18更新(v0.1.7.4)

基本的な使い方は変わっていません。 ⇒ 使用方法

すでに使われている方はexeファイルの上書きとHtmlAgilityPack.dllをexeと
同じフォルダに移動させるだけで、設定ファイルはそのまま引き継げます。
ただし、今回から.NET Framework 4.0が必須となります。

Windows7とWindows8.1では一通り動作確認はしていますが、何か不具合が
あればコメント欄にて報告していただけると助かります。特に書籍情報取得
部分に関しては取得先サイトが仕様変更されると取得できなくなるので、随時
報告頂ければその都度気が向いたら対応いたします。(AWS以外は保証外)


~ 今回の変更点 ~
●Amazon Web Services以外の書籍情報取検索能追加
 3つの取得先を新たに追加しましたが、それぞれ以下のような特徴があります。

 ・国立国会図書館サーチ
  →バーコードからのISBN検索はそれなりにヒットするが巻数が取得できない。
    キーワード検索は検索ワードによっては非常に時間がかかるため、20秒
    待っても返ってこない場合はタイムアウトとなります。

 ・日本書籍出版協会(Books.or.jp)
  →協会名の割に登録書籍が少なくあまり使い物にならない。登録されている
   書籍に関してはISBN検索でそれなりに情報が取得できるが、キーワード
   検索の場合一覧でISBNコードが取得できない。

 ・booksearch.jp
  →今のところAWS以外では一番おススメ。ISBNが一致すればほぼ取得可能。
    キーワード検索時に出版社欄が空白になりますが、ISBNが取得出来て
    いる行を選択すれば、検索画面が閉じる際にISBNから再検索してすべて
    の書籍情報を取得できます。

 まぁ、上記いずれも仕様変更等で突然使えなくなる可能性が高いので、確実に
 書籍情報を取得したいならAWS登録してください。

●ScanSnap iX500の読み取り設定切り替え機能追加
 iX500でWin7とWin8.1のみで動作確認。
 まずはScanSnap Managerでカラー/グレー読み取りに対応する読取設定を
 登録しておいた上で設定画面から「有効」チェックボックスにチェックを入れて
 ください。この時点で以下の設定ファイルが存在しない場合はエラーとなります。
  ・C:\Users\**\AppData\Roaming\PFU\ScanSnap\ConfigList.cfg
  ・C:\Users\**\AppData\Roaming\PFU\ScanSnap\PfuSsMon32.cfg
 ComboBox左のボタンを押すとキー押下画面が表示されるので、切替に
 割り当てたいキーを押してください。この時テキストボックス上にカーソル
 があっても動作は有効なので、なるべく書籍情報入力で使わないような
 キーを割り当てることをお勧めします。そして、それぞれカラー/グレーに
 対応する読み取り設定をComboBoxから選択してください。

●表紙画像選択時の左右ライン選択モード追加
 表紙画像をマウスドラッグで選択する際に、上端ぎりぎりから下端ぎりぎり
 をドラッグするのがやりにくかったので、どうせ高さは固定の場合が殆ど
 なので、高さは固定で左右のラインだけマウスドラッグで選択できるモード
 を追加。もちろん元の四角形選択にも切り替えて戻すことはできます。

●起動時のウィンドウ位置とサイズの復元機能追加
 毎回画面サイズを調整するのが面倒だったので、前回終了時の位置と
 画面サイズを復元するようにしました。セカンドディスプレイまでは対応
 していますが、画面構成が変わったり、3画面目以上の場所にあった
 場合は復元できませんので、その場合はプライマリ画面の左上を起点
 に位置がリセットされます。

●ウィンドウサイズ変更時の画像表示サイズ変更動作変更
 今までは画像の横幅に合わせてPictureBoxの縦サイズを調整していた
 ため、縦長の画面を表示した場合にスクロールバーが表示されて画像
 全体が見えないようになっていたので、基本は横幅に合わせつつ、縦幅
 が画面内に収まらない場合は縦幅を基準に横幅を調整して、常に画像
 全体が表示されるように動作を変更しました。


相変わらずいきなりサービス中止とか、値段が全然安くならないとか、
定価で買ったすぐ後に半額セールやられたりとか、専門書は無いとか
まったく利用したくなる要素が皆無な電子書籍サービスばっかりなので、
ぜひ皆さんも自炊を始めてみてはいかがでしょうか。

  


書籍自炊効率化

読み取り設定切り替えの動作テスト完了~

DSC07737.jpg

作業机の配置上、パソコンは隣の机の上に置いて作業をしており、
カラーの切り替えの度にパソコンの方に移動してマウスで反応の遅い
タスクトレイアイコンのメニューを操作して切り替えるのが非常に
めんどくさかったため、手元でボタン一発で切り替えられるようになり
かなり作業効率が上がりました(´ー`)

というかそんなに安い機械じゃないんだからせめて現在の読み取り
設定表示画面と切り替えボタンぐらい本体に標準で付いててもいい
んじゃないですかね>FUJITSUさん

カラー自動判定とかちょっと黄ばんだ本だとすぐカラーで読み取られて
まったく使いものにならないんでカラー/グレーの手動切り替えは絶対
手元に必須ですよ。次の機種での改善を期待してます。

で、なんかプログラムが楽しくなっちゃったのでオマケ機能も
ほぼ最低限の動作の確認までいけました。

今回のオマケ機能とはAmazonWebServices以外での書籍情報検索です。
というのも、WEBページ上から自動でデータを収集できるといろいろと捗る
よねということで、そのHTMLパーサのお勉強がてらHtml Agility Pack
を使って書籍情報取得のプログラムを実装してみました。

で、検索サイトとしてまず初めに使ったのが、日本書籍出版協会の
Books.or.jpというところ。どこぞのフリーソフトがそこのページから情報
を引っ張ってきているというのを見かけたので自分でもやってみた。

プログラムが出来たので早速試験用に生Scanデータが置いてあった
高津カリノの「WORKING!!」でテストをしてみるといきなりデータの
取得が出来ない。原因はというとスクエアエニックスがこの協会に
加盟していないのかこのサイトでは普通に検索しても情報は出て
きませんでした。

これでは話にならないので他のサービスを探したところ、国立国会
図書館が検索用APIを公開しているじゃあありませんか!
で、いろいろ試してみたのですが、まずISBN検索だと帰って来る
情報の中に巻数が含まれていない。キーワード検索だと、検索ワード
によってはものすごく時間がかかるのと、データベースの情報量は多い
のですが、多すぎてこちらが期待する情報がなかなか一発で出てこない。
ということで、これもあまり使い物にならない。

で、さらに調べているとbooksearch.jpというサイトを見つけました。
ここはなかなか検索結果が良好。さすがにアフィサイトだけあって
漢字が間違ってたりあやふやなキーワードを入れてもそれなりに
こちらが意図した検索結果が返ってきます。
国立国会図書館ではダメだったCD付き特装版とかでも出てくる
ので今のところAWS以外ではここが一番おススメです。ただし、
サイトの仕様変更があると取得できなくなる恐れがあるため注意。


まぁ何が言いたいかと言いますと実用的にはデータベースとしても
やっぱりAmazonが最強ということです。ただ、AWSを使うにはクレカの
登録とかいろいろと面倒な手続きが必要なため、それが面倒な人は
動作と検索結果はあまり保証できませんが今回のオマケ機能を使っ
てみて欲しいと思います。

あ、ソフト自体はこれからもうちょっと検索結果が正常じゃなかった場合
とかの動作調整をしてデバッグが終わったら公開したいと思います。

Cover_Creator

自炊効率化ソフトCover_Creator改修中・・・
他事に時間をとられて結局実家にいる間に動作テストまで出来ず・・・
現在寮にてもくもくと作業中・・・

CoverCreator_20140706231903d17.jpg

結局ScanSnapSDK使っても長尺モードでの読み込み命令は
出せないみたいなので、ソフト側からはキー押下で読み取り設定の
切り替えが出来るようにするだけにしました。iX500の隣にUSBテンキー
とか置いてそこにキー割当をしようかと思います。

その他、画像表示の拡大縮小やウィンドウサイズ変更時のPictureBoxの
サイズ変更動作の修正や表紙範囲選択動作なども変更。

一年ぶりにコードを見直してみて、改めてコレよく出来てるわー(自画自賛)
まぁあの時は仕事も辞めると決まって気持ち的には余裕な時期だったとは
いえ、前の会社で働きながらよくこんなの作ったよなー

今年もそろそろ例のイベントがまた始まるし、来週までにはオマケ機能まで
含めて実装完了してしまいたいなぁ・・・

テーマ:趣味と日記 - ジャンル:趣味・実用

プロフィール

yytune

Author:yytune
孤独な毒男です
いろいろ多趣味だけどどれも中途半端なのが悩み

Cover_Creator最新版

製作物一覧

[fg]マイホーム

カテゴリ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

月別アーカイブ

最新記事

最新コメント

最新トラックバック

リンク

検索フォーム

RSSリンクの表示

メール

メールはこちらからどうぞ。

ブロとも申請フォーム