2012-08-16 10 views
17

w bash mogę napisać następujący testBash - testowanie, czy łańcuch jest "większy" od innego - jak działa wewnętrznie?

[[ "f" > "a" ]] 

co skutkuje powrocie 0, to prawda. W jaki sposób bash wykonuje to porównanie? Z mojego rozumowania > wynika porównanie liczby całkowitej. Czy próbuje porównać wartość ASCII operandów?

+1

Tak, podejrzewam, że ma to miejsce w przypadku, gdy> oznacza jedno z dwoma strunami, a drugie z dwoma liczbami. Jednak nie jestem doświadczonym programistą basha. – VoronoiPotato

Odpowiedz

8

Z help test:

STRING1 > STRING2 
       True if STRING1 sorts after STRING2 lexicographically. 

Wewnętrznie atakujących albo wykorzystuje strcoll() lub strcmp() na to:

else if ((op[0] == '>' || op[0] == '<') && op[1] == '\0') 
    { 
    if (shell_compatibility_level > 40 && flags & TEST_LOCALE) 
     return ((op[0] == '>') ? (strcoll (arg1, arg2) > 0) : (strcoll (arg1, arg2) < 0)); 
    else 
     return ((op[0] == '>') ? (strcmp (arg1, arg2) > 0) : (strcmp (arg1, arg2) < 0)); 
    } 

te mimo porównuje kodów ASCII, pierwszej (stosowany podczas narodowe jest włączony) Przeprowadza bardziej szczegółowe porównanie, które nadaje się do sortowania w danym języku.

7

Jest to porównanie alfabetyczne (AIUI na kolejność sortowania mogą mieć wpływ bieżące ustawienia regionalne). Porównuje pierwszy znak każdego ciągu, a jeśli ten po lewej ma wyższą wartość, to jest prawdą, jeśli jest niższy, to fałsz; jeżeli są one takie same, a następnie porównuje drugi znak itd

To nie taka sama jak całkowita, dla porównania, że ​​używasz [[ 2 -gt 1 ]] lub ((2 > 1)). Aby zilustrować różnicę pomiędzy ciągiem i porównania liczby całkowitej, uważają, że wszystkie poniższe kryteria są „prawdziwe”:

[[ 2 > 10 ]]  # because "2" comes before "1" in ASCII sort order 
[[ 10 -gt 2 ]] # because 10 is a larger number than 2 
((10 > 2))  # ditto 
1

Tak, to porównuje wartość ASCII i jeśli równa następnie powtórzyć porównania w następnego znaku.

/* Copyright (C) 1991, 1996, 1997, 2003 Free Software Foundation, Inc. 
    This file is part of the GNU C Library. 

    The GNU C Library is free software; you can redistribute it and/or 
    modify it under the terms of the GNU Lesser General Public 
    License as published by the Free Software Foundation; either 
    version 2.1 of the License, or (at your option) any later version. 

    The GNU C Library is distributed in the hope that it will be useful, 
    but WITHOUT ANY WARRANTY; without even the implied warranty of 
    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU 
    Lesser General Public License for more details. 

    You should have received a copy of the GNU Lesser General Public 
    License along with the GNU C Library; if not, write to the Free 
    Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 
    02111-1307 USA. */ 

#include <string.h> 
#include <memcopy.h> 

#undef strcmp 

/* Compare S1 and S2, returning less than, equal to or 
    greater than zero if S1 is lexicographically less than, 
    equal to or greater than S2. */ 
int 
strcmp (p1, p2) 
    const char *p1; 
    const char *p2; 
{ 
    register const unsigned char *s1 = (const unsigned char *) p1; 
    register const unsigned char *s2 = (const unsigned char *) p2; 
    unsigned reg_char c1, c2; 

    do 
    { 
     c1 = (unsigned char) *s1++; 
     c2 = (unsigned char) *s2++; 
     if (c1 == '\0') 
     return c1 - c2; 
    } 
    while (c1 == c2); 

    return c1 - c2; 
} 
+2

Nie widzę powodu, dla którego wklejasz jakąś nieistotną funkcję 'strcmp()'. bash obsługuje ustawienia lokalne, aw tym przypadku używa 'strcoll()' zamiast tego, aby wykonać porównanie odpowiednie dla konkretnego zestawu znaków. –

+0

Masz prawo, ale strcmp ilustruje porównanie ciągów w prostszej formie. Celem jest pokazanie jak porównać ciąg w ogóle, a nie konkretną implementację basha. Metoda jest taka sama w bash, python, perlu, PHP, c, Java ... – olivecoder

+0

Więcej ... pytanie nie dotyczy nazwy funkcji, ale metody. – olivecoder

Powiązane problemy