Pregunta

¿Qué tipo de trabajo se ha realizado para determinar si una cadena específica pertenece a una ubicación geográfica? Por ejemplo:

'troy, ny'
'austin, texas'
'hotels in las vegas, nv'

Supongo que lo que estoy esperando es un enfoque estadístico que brinde un grado de confianza de que los dos primeros son ubicaciones. El último probablemente requeriría una heurística que agarra "% s,% s " y luego usa la misma técnica. Estoy buscando específicamente enfoques que no dependan demasiado de la propuesta 'en', ya que no es un indicador de ubicación totalmente inequívoco o constantemente disponible.

¿Alguien puede señalarme enfoques, documentos o utilidades existentes? Gracias!

¿Fue útil?

Solución

El problema que describe a menudo se denomina análisis de consultas geográficas o, más generalmente, recuperación de información geográfica.

Hubo una tarea reciente al hacer esto en CLEF 2007 ( http: //www.uni-hildesheim.de/geoclef/2007/Query-Parsing.htm ). El equipo ganador utilizó una gramática basada en reglas, que es similar a lo que probablemente no desee. Otro artículo en www2009 habla sobre GeoParser: http://www2009.eprints.org/239/ .

También hay algunos documentos sobre recuperación de información geográfica en CIKM 2007: http: //www.geo.unizh.ch/~rsp/gir07/accepted.html

No conozco ningún software de código abierto que haga esto, pero puede estar incluido en un motor de búsqueda como Lemur.

Otros consejos

Hay un enfoque muy interesante adoptado por Everyblock.com que se centra en cómo se expresan las ubicaciones en inglés: básicamente utilizan algunas expresiones regulares sofisticadas y extensas que ahora son de código abierto. Su aplicación está diseñada para escanear a través de artículos de noticias, reseñas y varios feeds de datos públicos y relacionarlos con ubicaciones específicas, y funciona bien. Expresiones como "Un incendio en el edificio en la esquina noreste de la calle 20 y Valencia en San Francisco". están geocodificados con mucha precisión. Puede estudiar la fuente aquí . La parte particular que probablemente desee es ebpub / ebpub / geocoder / base.py , ubicada en la descarga ebpub , y todo lo que la rodea, por ejemplo, comenzando con la clase SmartGeocoder y trabajando al revés.

Un enlace para ayudar: geonames.org search :

  

devuelve los nombres encontrados para el   searchterm como documento xml o json

ejemplo: http://ws.geonames.org/search? q = troy,% 20ny & amp; maxRows = 10

Estoy creando un geoparser gratuito en geocode.xyz

(actualmente admite unos 50 países europeos, pronto ofrecerá cobertura global)

Se puede encontrar una aplicación de muestra de geoparsing en OpenWikiMap

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top