この記事は5分で読めます
メールやチャットツールの進歩により、Faxを利用する組織は減りつつあります。しかし、Faxは電話回線のみで利用でき、使い方も簡単で手軽に使える機械となっていることから未だに利用する組織は数多く存在します。特に行政機関においてはまだまだ広く利用されており、小さな組織では公開されている連絡先に、メールアドレスはなくともFaxはあるということが少なくありません。こういった背景に合わせ、FaxにOCR(光学文字認識)を組み合わせたオープンソースのシステム「Shinsai FaxOCR」についてご紹介します。
Faxは古くから利用されていることに加え、PCがなくても利用でき、メールアドレスと違い送り主が明確になる利点があります。そのため、行政機関の情報収集においては未だに主力ツールの1つとなっています。しかし、Faxで扱うデータの多くが手書きとなることから、収集したデータをExcelなどに入力する作業が必要になり、これに時間とお金がかかります。
実際に2009年の新型インフルエンザによるパンデミックや2011年の東日本大震災の際には全国規模でFaxによる情報収集が行われ、大量に集められたFaxの手書きデータを人間の作業者がデータベースに打ち込む作業が発生しました。多くの人員と時間が割かれたものの、Faxで送られた情報がデータベースに入力されるまでにはラグが発生し、コストがかかるだけではなくスムーズな情報交換の妨げになりました。
人工知能による文字認識があらゆるソフトウェアに導入されているにも関わらず、こうした人力の作業が行われている現状は非効率と言わざるを得ません。また、少子化に加えて公務員の定員削減も進み、職員の生産性の向上は急務となっています。しかし、インフラの整備に人員とコストのかかるWebベースの情報収集にすぐに切り替えることも現実的ではないでしょう。
こうした課題に対し、Faxのデータを文字認識技術で読み取るOCR(光学文字認識)システムを応用することで、Faxを使った情報収集に関する業務を大幅に効率化することが可能です。従来の手法では、手書きで入力された数字・文字のデータについては人間が目で見て、手で入力する形でデータ化していました。OCRシステムでは、これを自動で読み取りデータ化することで、Excelへの入力作業を省略することが可能です。
すでに通販の受発注管理などで類似の技術が利用されていますが、こうしたシステムにはメーカーが独自開発したソフトウェアが用いられているために費用がかかります。また、帳票が固定化されており、特定の用途にしか使えないというケースが多々ありました。そこで、私達はExcelで使えるオープンソースソフトウェアとしてのShinsai FaxOCRを提供します。
Shinsai FaxOCRはオープンソースで提供され、様々な用途に用いることができます。例えば、災害時に行われる調査の1つに医療施設の空床数の調査において、災害対策を主導する行政機関は傷病者を搬送するために医療機関に空床数の報告を依頼し、医療機関は用紙に空床数を書いてFaxを送っていました。従来は行政機関の職員がこの用紙を見て手入力でExcelに入力していたのです。これをFaxOCRで効率化することが可能です。
①調査員は、FaxOCRシステムにExcelで作成した用紙の元データを送る。
②FaxOCRは、Excelのデータを元に配布用の用紙データ(PDF)を作成する。
③調査員は、用紙データ(もしくは用紙)を調査対象者へ送付する
④対象者は、データを書き込みFaxする。
⑤FaxOCRは、データを読み取り調査員は目視確認の上でデータを利用する。
具体的には、まずFaxOCRのシステムを使って情報送信用の用紙を作成し、医療機関に配ります。医療機関はそれに数字を記入しFaxを送るだけで、報告者側の負担は従来と変わりません。一方、行政機関の職員は受け取ったデータをFaxOCRシステムで読み取り、目視確認したものをデータベースに送るだけです。
実質的に、職員は用紙を作り、来たデータに対して目視確認をするだけですので、従来の方法に比べて作業は大幅に効率されています。災害時の他にも、定期的な情報収集や一回限りの大規模な調査にも応用が可能で、使い方次第では情報システムのアカウント作成において、Fax番号などを用いた2要素認証などにも使うことができるでしょう。FaxOCRシステムでは、Webベースの情報収集システムと比較していくつかのメリットがあります。誰もが情報発信を行えるWebの場合は認証システムなどのセキュリティに関する整備を施さなければなりませんが、電話回線をそのまま利用するFaxではそれが不要です。新たにアカウントを作成・管理する必要もなく、Faxがあればすぐに使えるようになるので、利用障壁も極めて低いです。そのため、FaxOCRの導入にはコストがほとんどかからず、情報を送る側も受け取る側も、負担はほとんどありません。
しかし、メリットばかりではありません。OCRによる文字認識精度は100%ではなく、人間による目視確認が必要です。すべてを手入力する必要はないものの、目で見てミスが見つかれば修正しなければなりません。また、ここでご紹介するソフトウェア自体は数字の認識に特化しているため、日本語の文字認識については別途研究開発が必要になります。こうした課題はあるものの、文字認識精度自体は学習によって向上し、様々な手法が考案されています。日本語の文字認識についてもすでに既存の手法がいくつか存在するため、性能向上に対する技術的なハードルはそこまで高くありません。
(目視による情報確認画面)
FaxOCRを用いれば、外部機関に対して数字に関する情報を収集し、自動的に集計するような単純作業が効率化できるようになります。何でも自動化できるというわけではないものの発展の余地があり、需要があれば改良や有償サポートの体制を整えることも可能です。コストを最低限に抑えつつ、困難を抱えた保険医療行政における情報技術の活用を進めていくため、現場の方々の支持を頂ければ幸いです。
ソフトウェア公開:Shinsai FaxOCR