ドキュメントスキャナーとは?
ドキュメントスキャナーは、デバイスのカメラをフラットベッドスキャナーに変えるツールです。書類、レシート、ホワイトボードを撮影すると、自動的にエッジを検出し、遠近の歪みを補正し、コントラストを強調して、共有・保存に適したきれいでシャープなスキャン画像を生成します。
内部では撮影画像に輝度勾配スキャンを走らせて書類の四隅を推定し、パースペクティブ変換でゆがんだ四角形をきれいな長方形に直しています。隅はドラッグで微調整でき、よく使う用紙比率(A4、レター、正方形)にワンクリックで合わせることも可能で、補正モードは「オリジナル」「グレースケール」「ハイコントラスト」「純黒白」「シャープ化(文字を引き締めたいとき)」「ホワイトボード(会議室ホワイトボードの影を消して色マーカーを際立たせたいとき)」の6種類から選べます。内蔵のテキスト認識が最終スキャンから編集可能なテキストを取り出し、認識を一度走らせると PDF 書き出しは透明な文字レイヤー付きの「検索可能な PDF」に切り替わり、どの PDF リーダーでも検索や本文コピーが行えます。
使い方
- カメラへのアクセスを許可し、ファインダー内に書類を配置するか、既存の写真をアップロードしてください。
- 検出されたコーナーポイントを必要に応じて調整し、遠近補正を適用して書類を平坦化します。
- 補正モード(グレースケール、ハイコントラスト、白黒、シャープ化、または会議用のホワイトボード)を選び、必要なら明るさとコントラストを微調整して、PNG・JPEG・PDF として保存します。先に内蔵テキスト認識を走らせておけば、PDF は透明な文字レイヤー付きの検索可能な PDF として保存され、ハイライトもコピーもできます。
使用するタイミング
- 経費精算用にレシートを取り込みたいけどスキャナを出すのが面倒なとき。
- 会議のホワイトボードを誰かに消される前に PDF として残したいとき。
- 外出先で手書きメモやサイン入り書類をデジタル化したいとき。
結果
会議中にホワイトボードの手書きメモをデジタル化したい場面で使えます。スキャナーを開いて斜めから撮影しても、ツールが遠近の歪みを自動補正し、コントラストを強調するため、出力PDFでは全ての文字がくっきり読める状態になります。
よくある質問
- 自動検出が四隅を取り違えるのはなぜですか?
- 検出は最も強い四角形のエッジを探す仕組みなので、背景がごちゃごちゃしていたり、用紙が机のふちと一体化していたりすると誤判定します。変換前に四つのハンドルを実際の用紙の角まで手で動かしてください。
- 出力をあとから OCR にかけても大丈夫ですか?
- はい、ページを離れずに取り出せます。補正後に補正ステップの「テキストを抽出」を押すと内蔵の認識エンジンがスキャンを読み取り、編集とコピーが可能なテキストを下のパネルに出力します。入力としては「ハイコントラスト」と「シャープ化」が最もきれいで、会議用ホワイトボードのマーカー書きには多くの場合「ホワイトボード」モードがこの2つよりさらに強いです。明るく均一な光と反射のない撮影は手書きの精度向上にいまも有効です。認識が終わると PDF 書き出しは検索可能な PDF に切り替わり、すべての単語に透明な文字レイヤーが乗るため、どの PDF リーダーでも検索やコピーが行えます。
- 出力フォーマットには何がありますか?
- シャープな単ページ出力には PNG、ファイルサイズを抑えたいときは JPEG(品質スライダーで圧縮率を調整)、複数ページをサイドに溜めてあれば PDF として書き出せます。先に内蔵テキスト認識を走らせておくと、PDF 書き出しは画像の上に透明な文字レイヤーをのせた検索可能な PDF に切り替わり、どの PDF リーダーでも本文を検索したりコピーしたりできます。いずれの形式も補正後の画像をフル解像度で埋め込むので、拡大しても文字が荒れません。
- ページを開いたあとはオフラインでも使えますか?
- 使えます。撮影、エッジ検出、透視変換、補正フィルターはすべて端末側で動作します。最初のページ読み込みのときだけ通信が必要で、書類の処理は外部に送りません。
- スキャン結果の端がぼやけてしまうのはなぜですか?
- 元の写真を斜めから撮りすぎると、補正のときに遠い側のエッジを大きく引き伸ばしてページを平らにすることになり、解像度が落ちます。なるべく真上から撮れば、紙全体が均一にシャープに仕上がります。