Regex: jak uzyskać zawartość z wewnętrznego znacznika (użyj javascript)?

Spis treści:Regex: jak uzyskać zawartość z wewnętrznego znacznika (użyj javascript)?

aa<b>1;2'3</b>hh<b>aaa</b>.. 
.<b>bbb</b> 
blabla..

chcę uzyskać wynik:

1;2'3aaabbb

tag mecz jest <b> i </b>

jak napisać regex przy użyciu javascript? dzięki!

Źródło

2010-04-12 Koerr

Lazyanno,

wtedy i tylko wtedy:

masz czytać SLaks „s zakładać (jak a także previous article he links to) i
pełni zrozumieć liczne i cudownych sposobów w którym wydobywania informacji z HTML przy użyciu wyrażeń regularnych może złamać i
jesteś pewni, że żadna z obaw stosować w przypadku (np można zagwarantować, że wejście nie będzie zawierać zagnieżdżone, niedopasowane itp <b>/</b> tagi lub wystąpienia <b> lub </b> ciągu <script>...</script> lub komentarz  tagi, etc.)
ty absolutnie pozytywnie i chce kontynuować regularne wydobycie ekspresji

... następnie użyć:

var str = "aa<b>1;2'3</b>hh<b>aaa</b>..\n.<b>bbb</b>\nblabla.."; 

var match, result = "", regex = /<b>(.*?)<\/b>/ig; 
while (match = regex.exec(str)) { result += match[1]; } 

alert(result);

Produkuje:

1;2'3aaabbb

Źródło

2010-04-12 15:38:11 vladr

fajnie !!! dziękuję! :)))) – Koerr

@lazyanno, przed wybraniem rozwiązania regex lub DOM (w oparciu o kryteria wydajności), upewnij się, że ** czas zarówno ** (** parsuj "reprezentacyjny" ciąg ** z obiema metodami kilka razy, w pętli i zobacz, co ** rzeczywisty czas ** w ** różnych przeglądarkach **.) – vladr

You cannot parse HTML using regular expressions.

Zamiast tego należy użyć DOM w JavaScript.

na przykład (jQuery)

var text = ""; 
$('<div>' + htmlSource + '</div>') 
    .find('b') 
    .each(function() { text += $(this).text(); });

I owinąć HTML w <div> znaczniku znaleźć zarówno zagnieżdżone, a nie zagnieżdżonej <b> elementy.

Źródło

2010-04-12 14:48:45 SLaks

1732348 to PUS WZ 42.odpowiada na ogromną liczbę pytań. upvoting dla niego zaczyna czuć się głupio, ale do licha, to nie przestanie być prawdziwe w najbliższym czasie ... –

Dla rekordu, nie możesz ** niezawodnie ** parsować HTML używając wyrażeń regularnych. Jeśli spełnione są określone warunki, informacje można * wyodrębnić * dobrze z dobrze sformułowanego (X) HTML z wyrażeń regularnych. – vladr

Chcę używać regex javascript, aby uzyskać wynik Nie lubię analizować HTML (to powoli) jakikolwiek inny pomysł? dzięki :) – Koerr

Oto przykład bez uzależnienia jQuery:

// get all elements with a certain tag name 
var b = document.getElementsByTagName("B"); 

// map() executes a function on each array member and 
// builds a new array from the function results... 
var text = b.map(function(element) { 
    // ...in this case we are interested in the element text 
    if (typeof element.textContent != "undefined") 
    return element.textContent; // standards compliant browsers 
    else 
    return element.innerText; // IE 
}); 

// now that we have an array of strings, we can join it 
var result = text.join('');

Źródło

2010-04-12 15:03:04 Tomalak

Nie sądzę, że jego kod HTML znajduje się w DOM. – SLaks

@SLaks: Hm ... Powiedział "treść strony:" w swoim poście. – Tomalak

Przeczytaj swój komentarz do mojej odpowiedzi. – SLaks

 var regex = /(<([^>]+)>)/ig; 
     var bdy="aa<b>1;2'3</b>hh<b>aaa</b>..\n.<b>bbb</b>\nblabla.."; 

     var result =bdy.replace(regex, ""); 
     alert(result) ;

Patrz: '?' http://jsfiddle.net/abdennour/gJ64g/

Źródło

2013-03-28 16:05:15

ten działa dla każdego tagu, szukał tego, dzięki – Flion