2013-07-18 13 views
5

Jest to przykład z another answer, który wyodrębnia tylko małe litery. (Python 3)tłumaczyć pustym ciągiem

import string 
delete_table = string.maketrans(
    string.ascii_lowercase, ' ' * len(string.ascii_lowercase) 
) 
table = string.maketrans('', '') 

"Agh#$%#%2341- -!zdrkfd".translate(table, delete_table) 

W tym przypadku ' ' * len(string.ascii_lowercase) odwzorowuje małe litery do pustej przestrzeni. Tak więc moje oczekiwanie jest to, że wszystkie małe litery zostaną zastąpione „”, pustej przestrzeni, ale to jest wyjście:

'ghzdrkfd' 

więc tutaj są moje pytania:

  1. Dlaczego jest wyjście różni się od moich oczekiwań?
  2. Kiedy patrzę na documentation, translate przyjmuje tylko jeden argument. Dlaczego przekazano dwa argumenty?

Odpowiedz

2

zostało powiązane z dokumentacją 3.x Pythona, ale jeśli translate() jest używany z wieloma argumentami następnie kod ten jest prawdopodobnie z Pythona 2.x gdzie to jest ważne. Oto documentation.

Jak widać, drugi argument jest opcjonalny i określa znaki, które powinny zostać usunięte z łańcucha wejściowego (w Pythonie 3.x można to zrobić, mapując znaki na None).

Tak więc dla "Agh#$%#%2341- -!zdrkfd".translate(table, delete_table) najpierw wszystkie znaki obecne w delete_table są usuwane, a następnie wykonywane jest tłumaczenie za pomocą table.

Od delete_table jest zbudowany przy użyciu string.maketrans() tłumaczenia wszystkie małe litery w przestrzeni, będzie to ciąg znaków, który zawiera każdy znak ASCII z wyjątkiem małych liter:

>>> delete_table = string.maketrans(string.ascii_lowercase, ' '*len(string.ascii_lowercase)) 
>>> delete_table 
'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f !"#$%&\'()*+,-./:;<=>[email protected][\\]^_`       {|}~\x7f\x80\x81\x82\x83\x84\x85\x86\x87\x88\x89\x8a\x8b\x8c\x8d\x8e\x8f\x90\x91\x92\x93\x94\x95\x96\x97\x98\x99\x9a\x9b\x9c\x9d\x9e\x9f\xa0\xa1\xa2\xa3\xa4\xa5\xa6\xa7\xa8\xa9\xaa\xab\xac\xad\xae\xaf\xb0\xb1\xb2\xb3\xb4\xb5\xb6\xb7\xb8\xb9\xba\xbb\xbc\xbd\xbe\xbf\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\xd2\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xdb\xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf7\xf8\xf9\xfa\xfb\xfc\xfd\xfe\xff' 
>>> ''.join(c for c in map(chr, range(0, 256)) if c not in delete_table) 
'abcdefghijklmnopqrstuvwxyz' 

Więc wszystkie inne znaki zostaną usunięte z łańcucha, a następnie tłumaczenie z table nic nie zmieni od czasu użycia string.maketrans('', '').

0

Istnieje wersja członkowska translate(), a także funkcja statyczna. Wersja z jednym argumentem działa zgodnie z oczekiwaniami, ale uważam, że jest to wersja statyczna, do której dzwonisz powyżej, być może niepoprawnie.

>>> "Agh#$%#%2341- -!zdrkfd".translate(delete_table) 
'A #$%#%2341- -!  '