本文へジャンプ サイト内検索

これは記事の個別表示です。一覧表示はメニューを選択してください。

iPhoneでOCR講習会

iPhoneのカメラ機能でOCRを体験しよう

オフィスレンズとOCRアプリを使って墨字原稿を読んでみよう!

まずはボイスオーバーをオンにする。

次にオフィスレンズを立ち上げる。

立ち上げるとカメラが起動しています。

画面下真ん中にキャプチャボタンがあるのでそこをさわって、キャプチャボタンと読み上げたところに選択をあわせておく。

ちなみにキャプチャボタンとはシャッターのことです。

次に、iPhoneのカメラで目的の原稿を撮影します。

読ませたい原稿を机に置いて、iPhoneのカメラレンズの位置を確認し、レンズが原稿に対してなるべくまっすぐに向き合うように向けて、原稿とレンズとの距離を探っていきます。

原稿を横長に置いたならiPhoneもそれにあわせて横長に持ち、縦長に置いたなら縦に、というようにiPhoneの持ち方の向きもあわせましょう。

iPhoneの構え方としては、まずは原稿を置いてそれを挟むように両ひじをつき、そしてなるべく脇を締めて肘を寝かさずなるべく高くiPhoneを持てる位置で両手で構えるようにすると、原稿とレンズとの距離がちょうどいいことが多いようです。

iPhoneを持つときは、カメラレンズを遮らないように、指が画面に当たらないように、持ちましょう。

うまくカメラが原稿全体を捉えると、iPhoneがバイブし、「準備完了、ダブルタップしてキャプチャ」、としゃべります。捉えてないと「端が検出されませんでした」としゃべっています。その場合は画面に原稿全体が入りきるようにレンズを原稿から少し遠ざけてみるか、原稿とiPhoneの位置がずれていないか調整してみましょう。

「準備完了、ダブルタップしてキャプチャ」としゃべる位置を見つけたら、その位置で動かないように、iPhoneの画面内どこでもいいのでダブルタップします。

するとシャッター音がして撮影されます。(iPhoneが原稿を捉えた位置で固めて、その上でダブルタップするためには、iPhoneを持つときにどれかの指はいつでもダブルタップできるようにフリーになるような持ち方をしてみてください。多分、人差し指をどちらかフリーにして、残った中指と親指でiPhone側面を挟むような持ち方がやりやすいんじゃないかと思います。)

この後、「処理が完了しました」としゃべるのが聞こえたら、画面の右下に「完了ボタン」というボタンがあるのでそこをさわって完了ボタンとしゃべったところで指を離し、後は画面のどこでもいいのでダブルタップします。

(完了ボタンは見た目ではチェックマークのついたボタンです)

すると「エクスポート先」としゃべりますので、その画面の中で「フォトライブラリ」としゃべるところを選択、ダブルタップ。

すると「画像を保存しました」としゃべります。(ちなみに、フォトライブラリとしゃべるところは、さきほどエクスポート先としゃべったところから右フリックを数回してもすぐに見つけられると思います。)

ここでオフィスレンズはおわるので、ホームボタンをおしてホーム画面に戻ります。

今度はOCRアプリを選択、立ち上げます。

OCRを立ち上げると「おーしーあーる」としゃべるので、その位置から右フリックすると「画像を選ぶ」というとこがあるのでそこを選びダブルタップ。

次に、「モーメント」とか、「カメラロール」とかの写真のフォルダ分けがありますので、その中からカメラロールを選びダブルタップ。(べつにモーメントからでも構いません。選んでいくとき、探す時の写真の並び方、格納のされ方がフォルダごとに違うだけです。)

カメラロールフォルダに入ると、画面内にこれまでに保存された写真が並んでいますので、指でなぞって、先ほどオフィスレンズで撮影したものを探します。(いくつか並んでいる場合、最後に撮影したものは一番下、右端など、すみっこに来ているのが普通です。iOSのバージョンで違うことがあるかもしれませんのでご了承ください。)

なぞってみてどれかの写真を選んだ時、それが特にタイトルをつけずに保存されたのであれば「写真、縦、3月18日、15、30、シャープ、イメージ」などとしゃべります。これは3月15日の15時30分に撮影されたものであることを示します。これをヒントに、先ほどオフィスレンズで撮影したものを探します。

今日撮影したものの場合は、「写真、縦、15、30、シャープ、イメージ」というように、日付は読まれないようです。

目的の写真を見つけたら選択し、ダブルタップ。

すると写真に写っていた文字がOCR認識されてテキスト化されます。写真を選んでダブルタップしたときに、おーしーあーる見出し、としゃべりますがそのまま少し待ちます。(認識に数秒かかります。)少しすると、おーしーあーる戻るボタン、としゃべります。その時点で画像のテキスト化が完了しました。

ではこれを実際に読み上げさせてみましょう。

おーしーあーる戻るボタン、としゃべったところから一回右フリックすると、読み込まれたテキストを初めから最後まで読みます。

初めから最後までずっと待ちながら読みたいところを探すのは大変という場合は、行送りや、単語送り、文字送り単位でも読めます。

その方法は、全体を読む位置に選択がある状態でローター選択動作をし、行送り読みしたいときには「行」、単語送り読みしたいときには「単語」としゃべったところでローター操作をやめます。

(ちなみにローター操作とは画面に二本の指を当てた状態にしその二本の指を画面に当てたまま、その二本の指でまるでツマミを回すような動作をする選択方法です。読み上げ単位の選択以外にも、読み上げ速度変更や文字入力モードの選択など、いくつかの選択変更がここで行えます。)

読み上げ単位を決めたら、その状態で縦フリックをすると、下フリックなら一単位先へ、上フリックなら一単位戻る、という読み方ができます。

以上、オフィスレンズで撮影した写真をOCRアプリで読む手順をご説明致しました。

あと、このOCRアプリでは読み込んだテキストをメールで送る機能も付いています。

テキストを認識し読みあげた画面で右フリックをすると、「保存する」というボタンがあり、そこを選んでダブルタップすると、名前をつけてこの読み込んだテキストを保存できます。保存が完了すると、先のテキスト読み上げのところに戻り、ここで右フリックしていくと、保存するボタンの先に「メールする」というボタンが増えていますので、これを選んでダブルタップ。送り先アドレスを入力して送信すれば、このテキストが添付ファイルとして付いたメールを送ることができます。

制作著作 VIC システム部 1999-/ Powered by ek-MyWEB.com 2.0RC2