画像内のテキスト領域とグラフィック領域を決定する

質問

この質問をここに投稿すればよいかわかりませんか？しかし、誰かがそれを知っているなら、答えてください？

画像内のどの領域がテキストであり、どの領域がグラフィックであるかを決定するためのアルゴリズムは何ですか？そのような地域を分離する方法を意味しますか？（図または図）

解決

ほとんどのOCRソフトウェア、例えば ocropus, 、サポートレイアウト分析、これが必要なものです。

Mao、Rosenfeld＆Kanungo（2003）ドキュメント構造分析アルゴリズム：文献調査レイアウト分析アルゴリズムのかなり最近の調査を提供します。

他のヒント

最初のステップは、おそらくテキストと画像の間のよりシャープなコントラストを分離することです。これは、画像の導関数を取得することで実行できます。これは色の変化を示し、高い値はテキストの形と比較される可能性が高いです

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow