SQL Server 2005 texto completo índice de consulta a las palabras irrelevantes encontrar ayuda en el contenido

StackOverflow https://stackoverflow.com/questions/2492266

Pregunta

¿Hay una forma de consultar un índice de texto completo para ayudar a determinar las palabras irrelevantes adicionales? Me gustaría añadir unas palabras de ruido a medida y se preguntó si tener una forma de analizar el índice para ayudar a determinar sugerencias.

¿Fue útil?

Solución 2

Me decidí a buscar en lucene.net porque no estaba contento con los cálculos de relevancia en el servidor SQL indexación de texto completo.

he conseguido averiguar cómo indexar todo el contenido con bastante rapidez y luego se usa Lucas para encontrar las palabras irrelevantes. Ahora he editado los archivos de ruido de SQL Server en base a este análisis. Ahora tengo una solución de búsqueda que funciona razonablemente bien utilizando SQL Server indexación de texto completo, pero tengo la intención de pasar a lucene.net en el futuro.

El uso de SQL Server indexación de texto completo como base, he desarrollado un enfoque centrado en el dominio para encontrar contenido relevante utilizando la herramienta entendí. Después de una seria reflexión y ensayo, he usado muchas otras medidas para determinar la relevancia de un resultado de búsqueda que no sea lo que se proporciona mediante el análisis de contenido de texto para la frecuencia de los términos y la distancia palabra. SQL Server indexación de texto completo me proporcionó un gran comienzo, y ahora tengo una estrategia que pueda expresar usando Lucene que va a funcionar muy bien.

Se me habría llevado mucho más tiempo para entender Lucene, y desarrollar una estrategia para la búsqueda. Si alguien por ahí todavía está leyendo esto, utilizar la indexación de texto completo para probar su idea y luego pasar a Lucene una vez que tenga una estrategia sabes de trabajo para su dominio.

Otros consejos

Tan simple como en

http://arcanecode.com/2008/05/29/creating-and-customizing-noise-words-in-sql-server-2005-full-text-search/

donde esto se explica (cómo hacerlo). El subir con las apropiadas, sin embargo, es duro.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top