Mam aplikację, która czyta źródłowy html i pobiera wszystkie załączniki wiadomości e-mail. Działa to dobrze, z wyjątkiem faktu, że Microsoft Outlook ma jakąś dziwną wartość źródła, na przykład ...Zastąp ciąg znaków źródłowych html MS Outlook za pomocą wyrażenia regularnego?
<img width="163" height="39" id="Picture_x0020_1" src="cid:[email protected]" alt="Description: Description: Description: cid:[email protected]">
Po pierwsze, chciałbym go tylko Załączniki zmienić \ image001.png jako źródło. Również alt powinien być po prostu image001.png, nie tak długo dziwny alt. Nie bardzo wiem, jak to osiągnąć.
[Nie używaj wyrażenia regularnego do parsowania html] (http://stackoverflow.com/a/1732454/26226). – jrummell
Myślę, że tytuł był w porządku, po prostu zwracam uwagę, że Regex zwykle nie jest wiarygodny w analizie html. – jrummell
jeśli jesteś pewien, że 'tekst' będzie miał' ten sam wzór', 'ten sam format' i ** NIGDY ** nie zmieni się, ty ** POWATRZ ** używaj' REGEX', następnie ... To jest mało prawdopodobne w przypadku plików html ale myślę, że "REGEX" będzie tu dobrą opcją ... – Anirudha