Mam dużą listę plików, z których niektóre mają daty osadzone w nazwie pliku. Format dat jest niespójny i często niekompletny, np. "Aug06", "Aug2006", "August 2006", "08-06", "01-08-06", "2006", "011004" itd. Poza tym niektóre nazwy plików mają niepowiązane numery, które wyglądają nieco jak daty, np "20202010".Wyodrębnij niekonsekwentnie sformatowaną datę z ciągu znaków (analiza daty, NLP)
W skrócie, daty są zwykle niekompletne, czasami nie istnieją, są niespójnie sformatowane i są osadzone w ciągu znaków z innymi informacjami, np. "Zgłoś Aug06.xls".
Czy są dostępne jakieś moduły Perla, które wykonają przyzwoitą pracę zgadując datę z takiego ciągu? To nie musi być w 100% poprawne, ponieważ będzie ono weryfikowane ręcznie przez człowieka, ale staram się, aby rzeczy były tak proste, jak to tylko możliwe dla tej osoby i są tysiące wpisów do sprawdzenia :)
To jest trochę podobne do tego, jak to zrobiłem na końcu, ale moje jest znacznie dłuższe, brzydsze i przerażające :) Pozostawię pytanie otwarte na razie, na wypadek, gdyby ktoś wcześniej natknął się na problem, ale wydaje się, że lubię trochę przewijać własne rozwiązanie ... –
Twoja odpowiedź jest zasadniczo poprawna; wydaje się, że nie ma tam żadnych bibliotek, musisz to zrobić samemu :) –