Hough変換処理
Hough変換処理

スキャンして作成したデータには、紙粉の影響により赤色や黄色などのスジがどうしても生じてしまいます。
このスジは、スキャン時に機器から発する光が紙粉にあたることで、黄・赤・緑・青など多様な色になります。
通常は目視による検品でスジを補足していますが、薄い色になると目視検品のスピードも早いため、どうしても見落としが生じてしまいがちでしたが、Hough変換処理を施すことで、目視で補足しづらいスジなども事前に検知することができるようになりました。

※活字の書籍に非常に有効。漫画や写真などでは目視のみで対応しています。

ページサイズ異常値検出

スキャンの工程では、データ不良の原因となる重送や滑り、読み取りガラスの汚れなどが生じます。これらの原因が生じないように対策すると同時に、データ不良を確実に検知していくことが大切です。

そこで私達は、スキャンして作成したデータの全ページの縦と横の長さをシステムで計測することにしました。計測後、他のページと比較することで、異常値を検出し、目視で見落としがちなデータ不良をできる限り補足しています。

ページサイズ異常値検出
ページ折れ検知

ページ折れのデータの特徴を利用して、折れた際に生じる形や色をシステム側で検知しています。PDFデータを一度全ページJPG変換処理し、jpg1ファイルごとにデータ周囲の色(水色)や形を調べています。

※経年の利用や保管による折れ(長年の利用により角が潰れているような)は、修正などの対象外と致しております。

ページ折れの検知
傾斜補正処理

熟練スタッフが目視で検品時、文章に傾斜が見られる書籍データに対して傾斜補正処理を実施。PDFデータを一度すべてJPGファイルに変換し、1ページずつ傾きの角度を計算した上で、0.5~2度の範囲で傾きが検知されます。その際、黄ばみがある書籍データに対しては、黄ばみなどのノイズを除去した上で補正処理を実施しています。傾斜補正をおこなったファイルは、誤認識により傾かなくて良いページで傾きなどが生じてしまうため、再度全ページ目視で検品をおこなっています。

※傾斜補正は、活字中心の書籍のみが対象です。漫画や、図柄や画像の多い書籍ではおこなっておりません。

※傾斜補正は黄ばみなどのノイズを除去しておこなっておりますが、傾斜補正後のデータには黄ばみなどのノイズはそのまま残っております。ノイズ除去はあくまでも角度計算を正確におこなうためにおこなっております。

自社開発の傾斜補正システム
自社開発の目視検品システム

熟練スタッフによる目視検品をおこなうシステムで、チェック項目は、全部で14項目。落丁、ページ折れ、ゴミ混入(髪の毛や付箋など)、傾き、歪み、破れ、紙粉スジ、サイズ異常、ページ順番、上下逆、スキャンモード、奥付け、中表紙、ブックカバー。検品するスタッフの選考は、スキャンや修正作業などを6ヶ月以上おこなっていて、検品者として相応しいかどうかを試験したのち決定されます、つまり、仕事をもっとも深く理解している人材が検品作業に従事しています、検品作業は、誰にでも簡単に出来る作業ではないのです。

自社開発の目視検品システム
ページトップへ