Mam problem z paskiem interpunkcyjnym ze wskaźnika Solr Gdy znak interpunkcyjny następuje zaraz po słowie, to słowo nie jest poprawnie indeksowane.Solr: strip interpunkcja przed indeksem
Na przykład: jeśli zindeksujemy "Witaj, John", zasób nie zostanie znaleziony przez słowo kluczowe "cześć", podczas gdy nie będzie problemu, jeśli usuniemy przecinek po słowie "cześć".
Czy jest jakiś obiekt FilterFactory, który powinien usuwać znaki interpunkcyjne? Jakieś pomysły?
Dzięki, Bogdan.
Dla osób z przypadków brzegowych jak moje są generateWordParts = 1 będzie normalnie działać, ale jeśli robisz to, co robię, to nie będzie: Używam atrybut 'types' w WDFF do odwzorowania. i $ do ALPHA, dzięki czemu mogę dopasować terminy takie jak "10,00 $". Ma to negatywny skutek uboczny, polegający na tym, że okresy prefiksu i sufiksu są uwzględniane jako część słowa. Więc w moim przypadku odpowiedź @claytron może być lepiej dopasowana. –