質問

この質問をここに投稿すればよいかわかりませんか?しかし、誰かがそれを知っているなら、答えてください?

画像内のどの領域がテキストであり、どの領域がグラフィックであるかを決定するためのアルゴリズムは何ですか?そのような地域を分離する方法を意味しますか? (図または図)

役に立ちましたか?

解決

ほとんどのOCRソフトウェア、例えば ocropus, 、サポートレイアウト分析、これが必要なものです。

Mao、Rosenfeld&Kanungo(2003) ドキュメント構造分析アルゴリズム:文献調査 レイアウト分析アルゴリズムのかなり最近の調査を提供します。

他のヒント

最初のステップは、おそらくテキストと画像の間のよりシャープなコントラストを分離することです。これは、画像の導関数を取得することで実行できます。これは色の変化を示し、高い値はテキストの形と比較される可能性が高いです

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top