こんにちは、WPホームページ研究所の運営サポートチーム(@WP_LABO)です。
画像化されたイメージのなかから文字情報(テキストデータ)を取り出せたら「文字入力が省略できて楽なのに!」と考えられたご経験はないでしょうか?日々オウンドメディアで記事を作っていると少しでも効率的にコンテンツが作成できないかと悩むシチュエーションが出てきます。
今後も来訪ユーザーへ素早くコンテンツを届けたい状況では「1分」でも早く文章を書き終えて、記事を1秒でも早く公開したくなりますよね。仮に1日2、3記事を更新するスピードであれば1ヶ月間で約100記事を作成できます。さらにもし『1記事あたり5分程度の効率化』が図れれば30日間で500分(約8.3時間)も時間を浮かせることができます。効率化はコンテンツを量産する上でとても重要です。
本日は画像から文字を抽出する方法についてご紹介いたします。今回はスマートフォンのアプリ内でスクリーンショット(キャプチャ)をとった文字を取り出す手順を詳しく解説させていただきますね。
今回はGoogleアナリティクスのなかにあるURLをテキストで取り出してみます。解析データに残されたリファラーにきになるURLがあったのでチェックがてらテキスト情報にして引き抜いてみました。
目次
画像内にある文字をテキスト(.txt)データとして引き抜く方法
通常であれば「テキスト情報」を抜き出したい画像は手元に揃っているはずです。以下ではコピペができないアプリがあったので画面内でスクリーンショットを取ってあらかじめ画像を作成しています。
テキストを抜き出したい画面を見つける
まずは画面をスクリーンショット。多くの方はすでに文字を取り出したい画像がある状態だと思いますので下記の画像をキャプチャする手順は不要です。本記事ではあえてわかりやすくするよう含みました。
キャプチャ後に該当箇所を切り取る
そして、画像編集モードで必要な部分だけを切り取ります。
切り取った画像が以下です。「5とURLと1」という文字情報が含まれた画像です。
無料サービスOCR SERVICEを開く
では画像情報からテキストデータを取り出してみましょう。スマートフォンでテキスト抽出サービスのウェブサイトへアクセスしたら「Select file…」を選択してください。変換するサイトは最下部にあります。
テキストを読込みたい画像を選択する
次に「フォトライブラリ」からさきほどの画像を選択しましょう。
画像が選ばれました。
言語を選択する
URLは英語なので「English」でも構いませんが、「Japanese」を選びました。どの言語を選ぶかは画像内に含まれている文字にしたがって選択をすれば問題ありません。
フォーマットを選ぶ
そしてフォーマットに「Text Plain(txt)」を選びます。エクセル(xlsx)やワード(docx)も選べますので出力したいフォーマットに合わせてドキュメント形式を選択しましょう。
CONVERTを実行する
最後に「CONVERT」 をクリックしてください。
すると最下部にコピペ可能な状態のテキストが表示されます。
無事URLが取り出せました。1箇所に「半角スペース」が入っていて、URLの最後に「!」が入っていますがそれ以外は正しくテキストとして抽出できました。かなり精度の高いシステムですね。念のために言語を「English」で選び直して再度「CONVERT」してみるとすべての文字を正しく取り出せました。
Download Output Fileでダウンロード
もしファイルをダウンロードしたいときは「Download Output File」をクリックしましょう。
素晴らしいシステムですね。ちなみに画像内に「英語」と「日本語」が混ざっている状態であれば言語に「Japanese」を選択しておくと認識の精度が上がります。日本語を選んでいれば英語も日本語も自動で抽出してくれますが「English」を選んでいると日本語は文字化けします。ぜひお試しくださいませ。
▼ONLINE OCR
https://www.onlineocr.net
最新式の無料プラグインを事前公開
WordPressは公式サイトに登録済みのプラグインだけで全機能を補足しきれません。当サイトでは使いやすさを追求した魅惑的なプラグインを無料でダウンロードいただけます。運営ホームページのマーケティング力をさらに高めるチャンスです。まずは無料でDLしてお試しくださいませ。
→ 改良されたプラグインを確認する