JP EN
HOME / PROJECTS / 行政文章OCR
OCR・データ処理

行政文章OCRサービス
大規模文書デジタル化

行政機関の紙文書を高精度でデジタル化。AWS Batchによる
大規模並列処理で、数百万件の文書も短期間で処理可能。

99.5% 認識精度
100万件 月間処理能力
70% コスト削減
手書き対応 古文書も認識
OVERVIEW

プロジェクト概要

行政機関が保有する大量の紙文書をOCR技術でデジタル化するサービスです。AWS Step FunctionsとAWS Batchを活用した並列処理で膨大な文書を効率的に処理します。

手書き文字や古い印刷物にも対応した高精度OCRエンジンを採用。抽出データの検証・修正ワークフローも構築し、データ品質を担保しています。

CHALLENGE & SOLUTION

課題と解決策

大規模処理

課題

数百万件の文書を限られた期間内に処理する必要があった。

解決

AWS Batchによる並列処理で、1日10万件以上の処理を実現。

🔍

高精度認識

課題

手書き文字や古い印刷物の認識精度が低かった。

解決

AWS Textractと独自の後処理エンジンで99.5%の精度を達成。

品質管理

課題

OCR結果の検証・修正に多大な人的コストがかかっていた。

解決

AIによる自動検証と効率的な修正ワークフローを構築。

TECH STACK

使用技術

Next.js TypeScript AWS Step Functions AWS Batch Textract Lambda

同様のプロジェクトをお考えですか?

AIを活用した開発で、御社のプロジェクトも成功に導きます。
まずはお気軽にご相談ください。

無料で相談する