孤独な社会人の一人遊び
孤独な社会人の日記帳です.

書籍自炊効率化

読み取り設定切り替えの動作テスト完了~

DSC07737.jpg

作業机の配置上、パソコンは隣の机の上に置いて作業をしており、
カラーの切り替えの度にパソコンの方に移動してマウスで反応の遅い
タスクトレイアイコンのメニューを操作して切り替えるのが非常に
めんどくさかったため、手元でボタン一発で切り替えられるようになり
かなり作業効率が上がりました(´ー`)

というかそんなに安い機械じゃないんだからせめて現在の読み取り
設定表示画面と切り替えボタンぐらい本体に標準で付いててもいい
んじゃないですかね>FUJITSUさん

カラー自動判定とかちょっと黄ばんだ本だとすぐカラーで読み取られて
まったく使いものにならないんでカラー/グレーの手動切り替えは絶対
手元に必須ですよ。次の機種での改善を期待してます。

で、なんかプログラムが楽しくなっちゃったのでオマケ機能も
ほぼ最低限の動作の確認までいけました。

今回のオマケ機能とはAmazonWebServices以外での書籍情報検索です。
というのも、WEBページ上から自動でデータを収集できるといろいろと捗る
よねということで、そのHTMLパーサのお勉強がてらHtml Agility Pack
を使って書籍情報取得のプログラムを実装してみました。

で、検索サイトとしてまず初めに使ったのが、日本書籍出版協会の
Books.or.jpというところ。どこぞのフリーソフトがそこのページから情報
を引っ張ってきているというのを見かけたので自分でもやってみた。

プログラムが出来たので早速試験用に生Scanデータが置いてあった
高津カリノの「WORKING!!」でテストをしてみるといきなりデータの
取得が出来ない。原因はというとスクエアエニックスがこの協会に
加盟していないのかこのサイトでは普通に検索しても情報は出て
きませんでした。

これでは話にならないので他のサービスを探したところ、国立国会
図書館が検索用APIを公開しているじゃあありませんか!
で、いろいろ試してみたのですが、まずISBN検索だと帰って来る
情報の中に巻数が含まれていない。キーワード検索だと、検索ワード
によってはものすごく時間がかかるのと、データベースの情報量は多い
のですが、多すぎてこちらが期待する情報がなかなか一発で出てこない。
ということで、これもあまり使い物にならない。

で、さらに調べているとbooksearch.jpというサイトを見つけました。
ここはなかなか検索結果が良好。さすがにアフィサイトだけあって
漢字が間違ってたりあやふやなキーワードを入れてもそれなりに
こちらが意図した検索結果が返ってきます。
国立国会図書館ではダメだったCD付き特装版とかでも出てくる
ので今のところAWS以外ではここが一番おススメです。ただし、
サイトの仕様変更があると取得できなくなる恐れがあるため注意。


まぁ何が言いたいかと言いますと実用的にはデータベースとしても
やっぱりAmazonが最強ということです。ただ、AWSを使うにはクレカの
登録とかいろいろと面倒な手続きが必要なため、それが面倒な人は
動作と検索結果はあまり保証できませんが今回のオマケ機能を使っ
てみて欲しいと思います。

あ、ソフト自体はこれからもうちょっと検索結果が正常じゃなかった場合
とかの動作調整をしてデバッグが終わったら公開したいと思います。

コメント

コメントの投稿













管理者にだけ表示を許可する

トラックバック

プロフィール

yytune

Author:yytune
孤独な毒男です
いろいろ多趣味だけどどれも中途半端なのが悩み

Cover_Creator最新版

製作物一覧

[fg]マイホーム

カテゴリ

カレンダー

05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -

月別アーカイブ

最新記事

最新コメント

最新トラックバック

リンク

検索フォーム

RSSリンクの表示

メール

メールはこちらからどうぞ。

ブロとも申請フォーム