Wykonywanie wyrażeń regularnych w celu znalezienia plików zawierających jedno słowo, ale nie innych

Próbuję szybko znaleźć wszystkie pliki .java, które zawierają jeden termin, ale brakuje innego terminu. Używam MyEclipse 10.7 i jego "Szukaj | Funkcja wyszukiwania plików, która obsługuje wyrażenia regularne.Wykonywanie wyrażeń regularnych w celu znalezienia plików zawierających jedno słowo, ale nie innych

Czy w tym scenariuszu zostaną ponownie wykorzystane zadania? Jak wyglądałby prawidłowy wyrażenie regularne?

TIA, Steve

Źródło

2013-03-04 Fred

Jedynym rozwiązaniem mogę znaleźć do pracy jest następujące Regex:

^(?!.[\s\S]*MISSING_TERM).[\s\S]*INCLUDED_TERM.*$

Okazuje każdy plik, który zawiera INCLUDED_TERM ale brakuje MISSING_TERM, niezależnie od linii.

Kluczem jest \s\S, który zapewnia przeszukiwanie całego pliku, a nie każdego wiersza.

Źródło

2013-03-13 15:44:58 Fred

działa jak czar. –

(?m)\A(?=.*REGEX_TO_FIND)(?!.*MISSING_REGEX.*).*\z

regex może dostać trochę trudne, ale to rozpada się na dwie części.

Znajdź pasujący termin/wyrażenie/słowo. Ta część nie jest zbyt trudna, ponieważ na to zwykle wygląda regex.
Określenie terminu nie występuje. To trudna część, ale jest to możliwe.

Mam przykład HERE który pokazuje w jaki sposób chcesz znaleźć słowo connectReadOnly w tekście, a nie mogą znaleźć disconnect. Ponieważ tekst zawiera connectReadOnly, zaczyna szukać następnego elementu, nie znajdując disconnect. Od disconnect jest w tekście nie powiedzie się na cały ciąg (, co będzie potrzebne, aby cały plik pasował do). Jeśli bawisz się drugim utworem, częścią z negacją (?!.*disconnect.*), możesz ustawić to jako regex, którego potrzebujesz. W moim przykładzie nie chcę znaleźć disconnect w dowolnym miejscu w moim kodzie :) Można go łatwo zastąpić słowem do wyszukiwania, lub nawet bardziej złożonym wyrażeniem regularnym "nie znaleźć".

Kluczem jest użycie trybu wielowierszowego, który jest ustawiony na początku (?m), a następnie za pomocą początku/końca znaków ciąg. Używanie ^ i $ do rozpoczynania/kończenia linii, w której \A i rozpoczyna się i kończy łańcuch, rozszerzając w ten sposób dopasowanie na cały plik.

EDYCJA: W przypadku użycia pytania i disconnect: (?m)\A(?=.*connectReadOnly)(?!.*disconnect.*).*\z. Zaktualizowany przykład można znaleźć here.

Źródło

2013-03-04 20:06:55 Walls

Wydaje się być blisko, ale nadal zwraca wiele fałszywych alarmów (np. Plików zawierających oba terminy). Oto wyrażenie, które próbowałem, ale zwraca pliki, które zawierają oba terminy: (? M)^(? =. * ConnectReadOnly) ((?! rozłącz)) * Moim celem jest znalezienie plików, które mają " connectReadOnly "w dowolnej linii, ale brakuje terminu" rozłącz ". – Fred

@SAL Zmiany zostały wprowadzone w odpowiedzi, wypróbuj je ... teraz powinno działać :) – Walls

To też nie działa. Zastanawiam się, czy parser regex w Eclipse może być inny niż ten, którego używasz? Co znalazłem działa, po zestawieniu wskazówek z różnych źródeł:^(?!. [\ S \ S] * rozłącz). [\ S \ S] * connect. * $ – Fred

Można użyć coś takiego:

(?<!.*bar)foo(?!.*bar)

będzie pasował jeśli "foo" występuje jednak "bar" nie jest.

Uwaga: musisz skonfigurować swoją wyszukiwarkę do korzystania z wyrażeń regularnych (EX: Notepad ++ ma opcję o nazwie ". Matches newline"), ponieważ zwykle kropka reprezentuje dowolny znak , z wyjątkiem podziału linii.

Źródło

2013-03-04 20:14:43 Jamby

Jeśli chcesz go znaleźć w jednej linii, użyj go tak:

^(?!.*MISSING_TERM).*INCLUDED_TERM.*$

Można również użyć \ jako znak ucieczki, bo może trzeba go jak class\.variable.

Źródło

2017-04-20 10:34:28 leventunver

Właściwie to poprosiłem o to na osobne pytanie, ale zostałem odrzucony jak błyskawica. Właśnie dlatego odpowiedziałem na to pytanie. Wierzę, że ta informacja powinna trwać na stackoverflow. Poza tym jestem strasznie zrozpaczony. – leventunver

bardzo ładna odpowiedź (y). viva live broda. –

Wykonywanie wyrażeń regularnych w celu znalezienia plików zawierających jedno słowo, ale nie innych

Odpowiedz

Powiązane problemy