Dove posso trovare un elenco di parole 'stop' per Oracle Ricerca full-text?
-
24-10-2019 - |
Domanda
Ho un cliente testare il testo completo (esempio qui sotto) cercare un nuovo sito Oracle UCM. La stringa di testo casuale hanno scelto di test è stato 'test solo'. Che non è riuscito; dal mio test sembra 'solo' è una parola riservata, in quanto non è mai tornato da una ricerca full text (viene restituito dalle ricerche di metadati).
Ho trascorso la mattinata a cercare oracle.com e ha trovato questo che sembra abbastanza completo, tuttavia non ha 'solo'.
Quindi la mia domanda è quindi, è 'solo' una parola riservata. Dove posso trovare un elenco completo delle parole riservate per Oracle ricerca a testo integrale (10 g)?
Testo integrale esempio della stringa di ricerca;
(<ftx>test only</ftx>)
Aggiorna. Ho fatto un po 'di test. Sembra che ignora le parole che indicano luoghi o tempi; solo un po ', fino a quando, quando, dove, là, qui, vicino, che, che, su questo, loro.
Qualcuno può confermare? Non riesco a trovare questo in su Oracle ovunque.
Aggiornamento 2. Risposta di post Avrei dovuto cercato non parole 'stop' 'riservati'. Aggiornato il titolo della domanda e tag per riflettere.
Soluzione
Scommetto che il sistema sta cercando di ignorare automaticamente le parole che si verificano di frequente. Questo spiegherebbe il motivo per cui non è possibile trovare 'solo' ma 'onnly' può essere trovato. Si può cercare di 'a', 'una', ...
La lista che hai dato di parole che non funzionano sembra una parole molto comuni che spesso non sono le parole primari in una frase. Detto questo, non sono suscettibili di essere parole che si stanno cercando per una ricerca a testo integrale.
Quali sono le probabilità che si sta cercando per un articolo che include la parola 'che' e l'inclusione di questa parola è l'unica realtà che hai sul l'articolo?
Credo di aver trovato la tua lista .... Ironia della sorte dalla pagina wiki della ultima società ho iniziato ..: http://www.sugarcrm.com/wiki/index.php?title=Overview_of_Full_Text_Stop_Words#Default_Stop_Words_.28for_English.29
2.10.3 Modifying the Default Stoplist The default stoplist is always named CTXSYS.DEFAULT_STOPLIST. You can use the following procedures to modify this stoplist:
• CTX_DDL.ADD_STOPWORD
• CTX_DDL.REMOVE_STOPWORD
• CTX_DDL.ADD_STOPTHEME
• CTX_DDL.ADD_STOPCLASS
When you modify CTXSYS.DEFAULT_STOPLIST with the CTX_DDL package, you must re-create your index for the changes to take effect.
Lista stopwords predefinito:
a he out up
be more their at
had one will from
it than and is
only when corp not
she also in says
was by ms to
about her over
because most there
has or with
its that are
of which could
some an inc
we can mz
after his s
been mr they
have other would
last the as
on who for
such any into
were co no
all if so
but mrs this
Aggiornamento - Un bel white paper da parte di Oracle, che include quanto piena di testo opere La ricerca può essere scaricato da: http://www.oracle.com/technology/products/text/pdf/text_techwp.pdf . Essi indicano le stopwords e il fatto che v'è un elenco predefinito, ma non menzionano le parole stesse.
Altri suggerimenti
risposte supplementari:
-
Vedi le liste Oracle (11g) Stopword predefinita qui: rel http://download.oracle.com/docs/cd/B28359_01/text.111/b28304/astopsup.htm#i634475
-
La query seguente consente di elencare stopwords da tutti stoplists (per essere eseguito su schema
CTXSYS
):
SELECT * FROM DR$STOPWORD LEFT JOIN DR$STOPLIST ON DR$STOPWORD.SPW_SPL_ID = DR$STOPLIST.SPL_ID
Nei risultati, i campi SPL_*
provengono dalla tabella di sistema DR$STOPLIST
, ei campi SPW_*
dalla tabella DR$STOPWORD
- Da uno schema utente, definiti dall'utente stoplists e stopwords possono essere recuperate attraverso
SELECT * FROM CTX_USER_STOPLISTS;
SELECT * FROM CTX_USER_STOPWORDS;
parole chiave riservate: http://www.toadworld.com/KNOWLEDGE/ KnowledgeXpertforOracle / tabid / 648 / TopicID / SQL15 / Default.aspx cliccare su "parola chiave riservata parole" a sinistra.
"Solo" è nella lista.
Non sono sicuro che cosa sta succedendo nel vostro caso, ma non posso di imaging che Oracle non sosterrà la parola solo in ricerca a testo integrale. In molti casi full-text, è necessario cercare una parola. Che potrebbe essere il problema si è verificato?