Où puis-je trouver une liste de mots « Stop » pour Oracle FullText recherche?
-
24-10-2019 - |
Question
J'ai un test client le texte intégral (exemple ci-dessous) une recherche sur un nouveau site Oracle UCM. La chaîne de texte aléatoire ils ont choisi de test était « seul test ». Ce qui a échoué; de mon test, il semble « seulement » est un mot réservé, car il ne revient jamais d'une recherche en texte intégral (il est renvoyé de recherches méta-données).
J'ai passé la matinée à chercher oracle.com et trouvé cette qui semble assez complet, mais ne dispose pas « seulement ».
Alors ma question est, est donc « seulement » un mot réservé. Où puis-je trouver une liste complète des mots réservés pour la recherche de texte Oracle complet (10g)?
exemple de chaîne de recherche plein texte;
(<ftx>test only</ftx>)
Mise à jour. Je l'ai fait un peu plus de tests. On peut dire qu'elle ne tient pas compte des mots qui indiquent des lieux ou des temps; seulement, certains, jusqu'à ce que, quand, tout, où, là, ici, près, ce qui, à propos, cela, eux.
Quelqu'un peut-il confirmer? Je ne trouve pas cela dans le n'importe où Oracle.
Mise à jour 2. Réponse post J'ai cherché « stop » mots non « réservés ». Mise à jour le titre de la question et des balises à réfléchir.
La solution
Je parie que le système tente d'ignorer automatiquement les mots qui se posent. Cela expliquerait pourquoi vous ne trouvez pas « seulement » mais « onnly » est disponible. Pouvez-vous rechercher 'a', 'un', ...
La liste que vous avez donné des mots qui ne fonctionnent pas comme des regards mots très courants qui sont souvent pas les mots primaires dans une phrase. Compte tenu de cela, ils ne sont pas susceptibles d'être des mots que vous recherchez sur une recherche en texte intégral.
Quelles sont les chances que vous êtes à la recherche d'un article qui comprend le mot « que » et l'inclusion de ce mot est le seul fait que vous avez sur l'article?
Je pense que je trouve votre liste .... Ironie du sort de la page wiki de la dernière entreprise que j'ai commencé ..: http://www.sugarcrm.com/wiki/index.php?title=Overview_of_Full_Text_Stop_Words#Default_Stop_Words_.28for_English.29
2.10.3 Modifying the Default Stoplist The default stoplist is always named CTXSYS.DEFAULT_STOPLIST. You can use the following procedures to modify this stoplist:
• CTX_DDL.ADD_STOPWORD
• CTX_DDL.REMOVE_STOPWORD
• CTX_DDL.ADD_STOPTHEME
• CTX_DDL.ADD_STOPCLASS
When you modify CTXSYS.DEFAULT_STOPLIST with the CTX_DDL package, you must re-create your index for the changes to take effect.
Par défaut Liste des mots vides:
a he out up
be more their at
had one will from
it than and is
only when corp not
she also in says
was by ms to
about her over
because most there
has or with
its that are
of which could
some an inc
we can mz
after his s
been mr they
have other would
last the as
on who for
such any into
were co no
all if so
but mrs this
Mise à jour - Un bon livre blanc d'Oracle qui inclut le fonctionnement de la recherche plein texte peut être téléchargé à partir de: http://www.oracle.com/technology/products/text/pdf/text_techwp.pdf . Ils mentionnent les mots vides et le fait qu'il ya une liste par défaut, mais ne mentionnent pas les mots eux-mêmes.
Autres conseils
réponses supplémentaires:
-
Voir par défaut Oracle (11g) Les listes de termes ici: http://download.oracle.com/docs/cd/B28359_01/text.111/b28304/astopsup.htm#i634475
-
La requête suivante permet de la liste de mots interdits tous stoplists (à exécuter sur schéma
CTXSYS
):
SELECT * FROM DR$STOPWORD LEFT JOIN DR$STOPLIST ON DR$STOPWORD.SPW_SPL_ID = DR$STOPLIST.SPL_ID
Dans les résultats, les champs de SPL_*
proviennent de la table système DR$STOPLIST
, et les champs de SPW_*
de la table DR$STOPWORD
- A partir d'un schéma d'utilisateur, stoplists définis par l'utilisateur et les mots vides peut être récupéré par
SELECT * FROM CTX_USER_STOPLISTS;
SELECT * FROM CTX_USER_STOPWORDS;
Mots-clés réservés: http://www.toadworld.com/KNOWLEDGE/ KnowledgeXpertforOracle / tabid / 648 / TopicID / SQL15 / Default.aspx cliquer sur « Mot-clé mots réservés » à gauche.
"Only" est dans la liste.
Je ne sais pas ce qui se passe dans votre cas, mais je ne peux que l'imagerie Oracle ne supporte pas le seul mot à la recherche en texte intégral. Dans de nombreux cas de texte intégral, vous devez rechercher un mot. Serait-ce le problème que vous rencontrez?