AI OCRとは?通常のOCRとの違いやメリット、デメリット、導入事例を解説
2022.09.29
ビジネスから日常生活まで、既存の手法や作業の改善や課題解決のためにもAIが多く導入されるようになった。そのひとつが「AI OCR」だ。従来のOCRにAIを導入することで、学習による認識精度の向上も見込め、業務効率化や自動化にもつながる。
今後も注目が期待されるAI OCRの概要や種類、従来のOCRとの違いについて解説。導入によるメリットとデメリット、業務効率化のためのAI OCR導入事例を紹介する。
AI OCRとは
AI OCRの概要および通常のOCRとの違いを解説する。
AI OCRの概要
まずOCRとは”Optical Character Recognition”の略で、日本語では「光学文字認識」だ。書類や帳簿などに印字または書かれた手書きやテキストの部分をスキャンによって読み取り、デジタル化する技術を指す。
OCRにAI技術を搭載したのが、AI OCRにあたり、特に海外ではICR(Intelligent Character Recognitionの略)と呼ばれる場合がある。
AI OCRと通常のOCRとの違い
AI OCRとOCRの違いは、AI技術が導入されているかいないかだ。コンピューターが文字を認識するためには、デジタルデータ化が必要となる。ところが紙書類のテキストを都度データ入力し、デジタル変換するのは大変な手間となるだろう。この作業を手作業からとってかわり、効率化するためにOCRが用いられている。
ところがOCRでは紙書類に書かれているテキストとデジタル化した文字が異なる誤認識を起こすことがある。特にOCRの持つ文字の線が交差する箇所を数えて文字を認識するという特性から、シンプルな形状の文字は誤認識を起こしやすい傾向にある。さらに日本語はひらがな、カタカナ、漢字が混在しているため言語の中でもOCRが誤認識を起こしやすいといえるだろう。
OCRの誤認識という課題解決のためにAIが導入されたのが、AI OCRだ。AIは機械学習とディープラーニングができるため、誤認識を起こしても学習改善し、文字認識精度を上げていける。ほかにもOCRにはない機能や特徴をAI OCRは持っているため、作業の効率化や自動化にもつなげられるだろう。
AI OCRのメリット
AIを搭載することで、従来のOCRと比較すると多くのメリットが得られる。具体的なAI OCRがもたらすメリットを解説する。
学習により文字の読み取りや識別精度が上がる
従来のOCRは決められた範囲でしか文字の読み取りができなかったため、誤認識を起こしても修正ができなかった。AIを搭載することで誤認識を機械学習し、ディープランニングによって読み取りの精度を上げられる。デジタルのテキストよりも読み取りが難しい、手書き文字の識別精度も上げられるだろう。
専門用語や異なる言語も読み取れる
AIにあらかじめトレーニングデータで学習させることで、さまざまなテキストに対応できるのもAI OCRのメリットだ。日本語を含めた独自の文字を使う言語や、手書きの専門用語や業界用語の読み取りもできるようになる。
異なるフォーマットも読み取れる
従来のOCRは、テキストの読み込み前にフォーマットごとに定義を行う必要があった。帳簿フォーマットが非定型のAI OCRは、事前の定義を行わなくてもAIが項目などを自動検出できる。帳票をスキャンするだけで文字を読み取れるため、業務の効率化につながるだろう。
座標設定が不要
従来のOCRは、読み取り前に帳票のテキストの読み取り位置の座標設定が必要だった。座標がずれていると認識ができないために、座標設定はフォーマットごとに必須となる。
AI OCRのなかにはAIが自動で判別するオートセグメンテーション機能を搭載したものがあり、フォーマットごとの座標設定が不要になった。
文字やテキストの意味を持った状態でデジタル化できる
従来のOCRでは読み込んだ文字やテキストをデジタル化する際「読み込んだ文字やテキストはどのような意味があるか」を付与するために、手作業によるデータ入力が必要だった。
AI OCRは読み取った文字やテキストの項目や内容などの意味や目的も生成・抽出できるため、デジタル化におけるデータ入力作業が不要。作業の効率化が進んだのもメリットだ。
業務システムやRPAとの連携による効率化・自動化が実現できる
人が行っていた作業や業務をロボットやシステムなどのテクノロジーが代行すること、または自動化するためのソフトウェアを「RPA(Robotic Process Automation)」と呼ぶ。
AI OCRは業務システムやRPAと連携ができるため、業務の効率化や自動化が実現できる。
AI OCRのデメリット
AI OCR導入前に覚えておきたい、デメリットについて解説する。
100%の精度は不可能なためフォローが必要
AIによって文字やテキストの識別精度は上がったものの、AI OCRでも100%の識別精度を発揮することは今後も不可能とされている。
AIは誤認識をしても学習やディープラーニングによって識別精度は上げられるが、文字やテキストの読み取りすべてを任せることはできない。
誤認識を起こさないように手書き文字をスキャン前に認識しやすいように画像データにする、誤認識した文字は辞書テーブルと紐づけをして読み取り結果を補正するなど、人間の手によるフォローは必須となる。
人間による修正やチェックは必須となるものの、従来のOCRやOCRなしの目視と手作業によるデータ入力と比較すれば、AI OCRによって大幅な業務効率化は実現可能だ。
導入コストがかかる
AIを搭載することで多くのことが実現可能となったAI OCRは、当然ながら初期費用、ランニングコスト、サポートやオプションの料金など、導入にコストがかかる。AI OCRを導入する目的や用途を考えて、費用対効果をふまえたうえでAI OCRを導入するのが重要だ。
AI OCRの導入事例
AI OCRはおもに紙ベースの書類をデジタル化することで可能になる業務の効率化や省スペースなどの目的で導入される。
AI OCRを導入することで実現できる業務の事例を解説する。
各種申込書のデジタル化
公共料金や金融機関での振込や口座引き落とし、商品注文など各業種で発生する申込書は、対面や郵送で受け取る手書きの申込書、FAXでの申込書、Web上でのオンライン申込など手書きと紙書類、デジタルテキストが混在している。
AI OCRを導入することで異なるフォーマットの帳簿の文字やテキストを効率的に読み込み、申込書面の住所や氏名、番号などの申込や注文内容に意味を持ったままデジタル化できる。
医療機関の問診票や診断書のデジタル化
医療機関における問診票や診断書は、医師が診察を行いながら手書きで記入することもあれば、パソコンに入力することもある。
AI OCRによってフォーマットの異なる問診票や診断書をデジタル化できるため、患者のカルテの管理や紹介状、処方箋の出力などさまざまな業務と連携できる。
教育機関や資格試験の答案のデジタル化
教育機関や資格取得における試験の答案は手書きがほとんどのため、OCRでは誤認識を起こしやすい。
AI OCRは手書き文字も高い精度で識別が可能になるため、答案のデジタル化による採点や成績管理、合格率などのデータの抽出などにも活用できる。
マーケティングやCSRでの回収したアンケートや意見のデジタル化
顧客の意見やアンケートの結果も、手書きの紙書面もあればオンラインアンケートによるデジタルデータもある。
AI OCRなら異なるフォーマットのアンケートや意見のデジタル化もでき、手書き文字も識別しやすい。アンケートの結果の分析にも役立つだろう。
FAXや名刺のデジタル化
FAXや名刺などビジネス上では必然的に紙書類によるやりとりも発生する。
AI OCRは、FAXや名刺なども項目に意味を持った状態でデジタル化できるため、ペーパーレス化による保管の省スペースや紛失による情報漏洩などのリスク回避にも活用できる。
AI OCR導入時のチェックポイント
業務効率化やペーパーレス化を目的にAI OCRを導入するときにチェックすべきポイントを解説する。
読み取りたい文字や言語に対応しているか
AI OCRは多くのベンダーからリリースされている。AI OCRによって手書き識別が得意、活字の識別が得意かは異なる。おもに読み取りたい帳票の文字の識別精度が高いかどうかをチェックしよう。
また、日本語のみに対応しているものもあれば、多言語に対応しているものもある。海外とのやり取りや多言語の帳票を取り扱う機会が多い場合は、多言語対応のAI OCRが選択肢となる。
操作方法やフォロー体制に問題はないか
AI OCRを導入しても、操作する側の従業員が使いこなせなければ業務の効率化は進まない。操作性や従業員のデジタルリテラシーなどをふまえて導入するものを選ぼう。
また、操作性だけでなく識別精度が100%ではないAI OCRの成果を最大化するためには、読み取り前後の人間によるフォローや目視によるチェック、修正などが必要となる。操作性やフォロー体制に問題がないかを確認後、必要に応じて導入前後に取り扱いに関するセミナーや研修会を設けるのも有効だ。
導入コストは適切か
AI OCR導入にはさまざまなコストがかかる。ただし、AI OCR導入によって人の手による作業が削減され、業務の効率化やペーパーレスによるコストカットにもつながるだろう。
費用対効果を考えたうえで、適切な導入コストのものを選ぶのが重要だ。
代表的なAI OCRのサービス
AI OCRはさまざまなベンダーからリリースされている。自社の持つ課題や効率化したい業務に合わせたAI OCRを選ぼう。代表的なAI OCRのサービスを紹介する。
DX Suite(AI inside)
「ニューノーマル時代にAI-OCRで拡大するOCRソリューション市場動向 2021年度版」(デロイトトーマツミック経済研究所株式会社2021年3月発刊)より、2021年OCRベンダーのソフトウェアライセンス売上のうちクラウド売上において、市場シェアナンバーワンの実績をほこるAI OCR。
実際の顧客の声を取り入れた自社開発の文字認識AIは、手書き、活字、傾いた画像なども高い精度での読み込みを実現する。非定型帳票も対応可能、マウスクリックで操作できるユーザーインターフェースなど、使いやすさへの機能も充実している。
CLOVA OCR (LINE)
LINEがリリースするAI OCRで、2019年3月29日時点の文書解析と認識に関する国際会議(ICDAR)にて認識精度世界ナンバーワンを獲得。悪条件下での文字のほか、多言語、専門用語も高い読み取り精度を誇る。
導入前に30日間の無料トライアルが可能、最短2日で導入可能、契約後2ヶ月間の無償導入支援サポートが受けられるなど、導入しやすい工夫も豊富にそろっている。
eas(うるる)
99.98%のAI OCRによる高精度な読み取り、さらに人力によるデータ確認と修正がセットになったサービス。
AI OCRによる読み取り後の人の手によるフォローも一貫して行えるため、大幅な業務効率化につながる。1,000枚程度の書類の場合、平均1時間ほどで納品できるため、データ化したい書類の量に応じたスピーディな対応も受けられる。
SmartRead(Cogent Labs)
さまざまなタイプの帳簿の文字読み取りに対応できるAI OCR。さらにサードパーティなどのツールを活用することで、既存の業務システムとの連携もできる。
読み取ったデータをそのままシステム上で活用できるため、業務の効率化や定型業務の自動化にも活用可能だ。使いやすいユーザーインターフェースを導入しているため、研修や教育の必要なくスムーズな導入も実現できる。
AI OCRはさまざまな業種の業務効率化を実現できる
AI OCRの概要やメリット、デメリット、活用事例や導入時の注意、代表的なAI OCRのサービスを紹介した。
OCRにAIを導入したことで、誤認識を学習しより高い精度での読み取りや、読み取り項目に意味を付与したままのデータ化が可能となった。100%の精度は実現できないが、人力もフォローに入ることでより正確な文字読み取りを可能とし、業務の効率化にもつなげられるだろう。