2010-05-17 11 views
7

Mam plik tak:Mecz na wielu liniach perl wyrażenia regularnego

01 00 01 14 c0 00 01 10 01 00 00 16 00 00 00 64 
00 00 00 65 00 00 01 07 40 00 00 22 68 61 6c 2e 
6f 70 65 6e 65 74 2e 63 6f 6d 3b 30 30 30 30 30 
30 30 30 32 3b 30 00 00 00 00 01 08 40 00 00 1e 
68 61 6c 2e 6f 70 65 6e 65 74 2d 74 65 6c 65 63 
6f 6d 2e 6c 61 6e 00 00 00 00 01 28 40 00 00 21 
72 65 61 6c 6d 31 2e 6f 70 65 6e 65 74 2d 74 65 
6c 65 63 6f 6d 2e 6c 61 6e 00 00 00 00 00 01 25 
40 00 00 1e 68 61 6c 2e 6f 70 65 6e 65 74 2d 74 
65 6c 65 63 6f 6d 2e 6c 61 6e 00 00 00 00 01 1b 
40 00 00 20 72 65 61 6c 6d 2e 6f 70 65 6e 65 74 
2d 74 65 6c 65 63 6f 6d 2e 6c 61 6e 00 00 01 02 
40 00 00 0c 01 00 00 16 00 00 01 a0 40 00 00 0c 
00 00 00 01 00 00 01 9f 40 00 00 0c 00 00 00 00 
00 00 01 16 40 00 00 0c 00 00 00 00 00 00 01 bb 
40 00 00 28 00 00 01 c2 40 00 00 0c 00 00 00 00 
00 00 01 bc 40 00 00 13 31 39 37 37 31 31 31 32 
32 33 31 00 

Czytam plik, a następnie znalezienie pewnych oktety i zastępując je tagami:

while(<FH>){ 
    $line =~ s/(00 00 00 64)/<incr4> /g; 
    $line =~ s/(00 00 00 65)/<incr4> /g; 
    $line =~ s/(30 30 30 30 30 32)/<incr6ascii:999999:0>/g; 
    $line =~ s/(31 31 32 32 33 31)/<incr6ascii:999999:0>/g; 
    print OUTPUT $line; 
} 

Tak na przykład , 00 00 00 64 zostanie zastąpiony przez znacznik <incr4>. To działało dobrze, ale wydaje się, że nie jest już w stanie dopasować się do wielu linii. Na przykład wzorzec 31 31 32 32 33 31 przebiega przez wiele linii, a wyrażenie regularne nie wydaje się go przechwytywać. Próbowałem użyć modyfikatorów wzorca/m/s, aby zignorować nowe linie, ale też nie pasowały do ​​nich. Jedynym sposobem wokół niego mogę wymyślić, jest przeczytać cały plik do łańcucha przy użyciu:

undef $/; 
my $whole_file = <FH>; 
my $line = $whole_file; 
$line =~ s/(00 00 00 64)/<incr4> /g; 
$line =~ s/(00 00 00 65)/<incr4> /g; 
$line =~ s/(30 30 30 30 30 32)/<incr6ascii:999999:0>/g; 
$line =~ s/(31 31 32 32 33 31)/<incr6ascii:999999:0>/g; 
print OUTPUT $line; 

To działa, znaczniki się prawidłowo włożony, ale struktura pliku jest radykalnie zmieniony. Wszystko jest wyrzucane na jednej linii. Chciałbym zachować strukturę pliku, tak jak tutaj wygląda. Jakieś pomysły, w jaki sposób mogę to zrobić?

/John

Odpowiedz

4

Sztuką jest, aby dopasować klasę całej przestrzeni jak znaki \s:

my $file = do {local (@ARGV, $/) = 'filename.txt'; <>}; # slurp file 

my %tr = ( # setup a translation table 
    '00 00 00 64'  => '<incr4>', 
    '00 00 00 65'  => '<incr4>', 
    '00 30 30 30 30 32' => '<incr6ascii:999999:0>', 
    '31 31 32 32 33 31' => '<incr6ascii:999999:0>', 
); 

for (keys %tr) { 
    my $re = join '\s+' => split; # construct new regex 

    $file =~ s{($re)}{ 
     $1 =~ /\n/ ? "\n$tr{$_}" : $tr{$_} # if octets contained \n, add \n 
    }ge # match multiple times, execute the replacement block as perl code 
} 
print $file; 
+0

Doskonała! Działa idealnie ... Nigdy nie myślałem o używaniu mapy hash, genialne rozwiązanie! – John

+1

+1: Świetne rozwiązanie, po prostu umieść na końcu modyfikator '/ x'! – Zaid

Powiązane problemy