2012-07-10 11 views
12

Dla ciągu "aa \ nbb \ ncc" Chcę dopasować od ostatniej litery lewej do pierwszej nowej linii ("a") do końca oczekuje multi ciąg linii i że

"aa\nbb\ncc" =~ qr/(. $ .+)/xms mecze a\nbb\ncc

i że

"aa\nbb\ncc\n" =~ qr/(. $ .+)/xms mecze a\nbb\ncc\n.

Ale nie udało mi się zdobyć "aa\nbb\ncc" =~ qr/(. $ .+)/xms i dopasować c\n dla "aa\nbb\ncc" =~ qr/(. $ .+)/xms.

Używanie qr/(. $ ..+)/xms Mam oczekiwane wyniki (zobacz przykładowy kod).

Wersja perl 5.14.2.

Czy ktoś może podać wyjaśnienie tego zachowania?

perldoc perlre:

m Treat string as multiple lines. That is, change "^" and "$" 
     from matching the start or end of the string to matching the start 
     or end of any line anywhere within the string. 

    s Treat string as single line. That is, change "." to match any character 
     whatsoever, even a newline, which normally it would not match. 

     Used together, as "/ms", they let the "." match any character whatsoever, 
     while still allowing "^" and "$" to match, respectively, just after and 
     just before ewlines within the string. 

    \z Match only at end of string 

Running Poniższy przykład kodu:

#!/usr/bin/env perl 

use strict; 
use warnings; 

print "Multiline string : ", '"aa\nbb\ncc"', "\n\n"; 
my $str = "aa\nbb\ncc"; 

print_match($str, qr/(. $)/xms);  # matches "a" 
print_match($str, qr/(. $ .)/xms);  # matches "a\n" 
print_match($str, qr/(. $ ..)/xms); # matches "a\nb" 
print_match($str, qr/(. $ ..+)/xms); # matches "a\nbb\ncc" 
print_match($str, qr/(. $ .+)/xms); # NO MATCH ! Why ??? 
print_match($str, qr/(. $ .+ \z)/xms); # NO MATCH ! Why ??? 

print "\nMultiline string now with terminating newline : ", '"aa\nbb\ncc\n"', "\n\n"; 
$str = "aa\nbb\ncc\n"; 

print_match($str, qr/(. $)/xms);  # matches "a" 
print_match($str, qr/(. $ .)/xms);  # matches "a\n" 
print_match($str, qr/(. $ ..)/xms); # matches "a\nb" 
print_match($str, qr/(. $ ..+)/xms); # matches "a\nbb\ncc\n" 
print_match($str, qr/(. $ .+)/xms); # MATCHES "c\n" ! Why ??? 
print_match($str, qr/(. $ .+ \z)/xms); # MATCHES "c\n" ! Why ??? 

sub print_match { 
    my ($str, $regex) = @_; 
    $str =~ $regex; 
    if ($1) { 
     printf "--> %-20s matched : >%s< \n", $regex, $1; 
    } 
    else { 
     printf "--> %-20s : no match !\n", $regex; 
    } 
} 

wyjście jest:

Multiline string : "aa\nbb\ncc" 

--> (?^msx:(. $))  matched : >a< 
--> (?^msx:(. $ .)) matched : >a 
< 
--> (?^msx:(. $ ..)) matched : >a 
b< 
--> (?^msx:(. $ ..+)) matched : >a 
bb 
cc< 
--> (?^msx:(. $ .+)) : no match ! 

Multiline string now with terminating newline : "aa\nbb\ncc\n" 

--> (?^msx:(. $))  matched : >a< 
--> (?^msx:(. $ .)) matched : >a 
< 
--> (?^msx:(. $ ..)) matched : >a 
b< 
--> (?^msx:(. $ ..+)) matched : >a 
bb 
cc 
< 
--> (?^msx:(. $ .+)) matched : >c 
< 
+0

Wydaje się, że jest to błąd w Perlu. Dobre znalezisko! Zależnie: '' a \ nb "' dopasowuje 'm/a $ ... \ z/ms' zamiast' m/a $ .. \ z/ms'; * Ale *, kiedy dodać nawiasy wokół punktów, aby spróbować dowiedzieć się, co się dzieje, to nagle mecze 'm/a $ (.) (.) \ Oo/ms' zamiast' M/A $(). (.) (.) \ z/ms'. – ruakh

+0

Raczej dziwnie. To samo dotyczy perl 5.12.2. – katastrophos

Odpowiedz

8

To błąd. Proszę go zgłosić, uruchamiając także linię poleceń perlbug.

$ perl -E'say "aa\nbb\ncc" =~ qr/(. $ .+)/xms ? ">$1<" : 0' 
0 

$ perl -E'say "aa\nbb\ncc\n" =~ qr/(. $ .+)/xms ? ">$1<" : 0' 
>c 
< 

$ perl -v 
... 
This is perl 5, version 16, subversion 0 (v5.16.0) built for x86_64-linux 
... 

Tak jak powiedziałeś, powinni dopasować "a\nbb\ncc" i "a\nbb\ncc\n" odpowiednio. Istnieją optymalizacje związane z $. Wydaje się, że jeden z nich nie wziął pod uwagę /ms.


PS — Możesz być zainteresowany use re 'debug';.

$ perl -Mre=debug -E'say "aa\nbb\ncc" =~ qr/(. $ .+)/xms ? ">$1<" : 0' 
Compiling REx "(. $ .+)" 
Final program: 
    1: OPEN1 (3) 
    3: SANY (4) 
    4: MEOL (5) 
    5: PLUS (7) 
    6:  SANY (0) 
    7: CLOSE1 (9) 
    9: END (0) 
anchored ""$ at 2 minlen 2 
Matching REx "(. $ .+)" against "aa%nbb%ncc" 
    0 <> <aa%nbb%ncc>   | 1:OPEN1(3) 
    0 <> <aa%nbb%ncc>   | 3:SANY(4) 
    1 <a> <a%nbb%ncc>   | 4:MEOL(5) 
            failed... 
    3 <aa%n> <bb%ncc>   | 1:OPEN1(3) 
    3 <aa%n> <bb%ncc>   | 3:SANY(4) 
    4 <aa%nb> <b%ncc>   | 4:MEOL(5) 
            failed... 
    6 <aa%nbb%n> <cc>   | 1:OPEN1(3) 
    6 <aa%nbb%n> <cc>   | 3:SANY(4) 
    7 <aa%nbb%nc> <c>   | 4:MEOL(5) 
            failed... 
Match failed 
0 
Freeing REx: "(. $ .+)" 
+0

Perl 5.16.0 wpływa też. wyślę raport o błędzie. Tnx za naprowadzenie mnie użyć re „debug”. – katastrophos

+1

[Fixed] (http://perl5.git.perl.org/perl.git/commitdiff/ac7af3f615eb56bda50bf123662b15779da26826?hp=79a3e5ea36208f2f54e36fa3a73c72808a6d0ad8) Perl 5,18 – ikegami

Powiązane problemy