Domanda

Così per il nostro progetto ultimo anno stiamo facendo un'applicazione lil nifty che consente a un utente take immagini di biglietti da visita dal proprio telefono cellulare, applicare l'OCR su di esso e ottenere tutte le informazioni richieste in forma stampabile ... Il mio problema è che SIFT è invariante rotazione ovvero non può distinguere tra un "u" e "n" e altri tali parole e numeri. Vorrei davvero apprezzare se si condivide tutte le idee che la gente d'acaro avere o venire con per superare questo problema. :) Grazie.

È stato utile?

Soluzione

Prova a spogliarsi quell'immagine quindi utilizzare diluita, se che fa rete neurale non utilizzo di lavoro

Altri suggerimenti

E 'vero che SIFT avrà difficoltà a lavorare fuori 'u' e 'n' caratteri simili, ma se si vuole veramente a bastone con SIFT (il progetto finale è probabilmente finito ora ...) si può sempre applicare un po' pre- elaborazione sulle immagini come 'u' e 'n' mettendo sottolineature sotto di loro nel giusto orientamento e lasciare SIFT sapere che 'u' con la sottolineatura è 'u', ecc.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top