OK, myślę, że mam zamiar iść z hybrydowym niestandardowy zestaw funkcji:
Koduje. Zastosowanie encodeURIComponent(), a następnie umieścić z powrotem w ukośniki
Dekodowanie: dekoduj wszystkie znalezione wartości% szesnastkowe.
Oto bardziej kompletny wariant co skończyło się stosując (obsługuje Unicode poprawnie, zbyt):
function quoteUrl(url, safe) {
if (typeof(safe) !== 'string') {
safe = '/'; // Don't escape slashes by default
}
url = encodeURIComponent(url);
// Unescape characters that were in the safe list
toUnencode = [ ];
for (var i = safe.length - 1; i >= 0; --i) {
var encoded = encodeURIComponent(safe[i]);
if (encoded !== safe.charAt(i)) { // Ignore safe char if it wasn't escaped
toUnencode.push(encoded);
}
}
url = url.replace(new RegExp(toUnencode.join('|'), 'ig'), decodeURIComponent);
return url;
}
var unquoteUrl = decodeURIComponent; // Make alias to have symmetric function names
Należy pamiętać, że jeśli nie trzeba „bezpieczne” znaków podczas kodowania ('/'
domyślnie Python), można wtedy bezpośrednio korzystać z wbudowanych funkcji encodeURIComponent()
i decodeURIComponent()
.
Ponadto, jeśli istnieją znaki Unicode (czyli postacie z kodowy> = 128) w łańcuchu, a następnie w celu utrzymania kompatybilności z JavaScript na encodeURIComponent()
, Python quote_url()
musiałyby być:
def quote_url(url, safe):
"""URL-encodes a string (either str (i.e. ASCII) or unicode);
uses de-facto UTF-8 encoding to handle Unicode codepoints in given string.
"""
return urllib.quote(unicode(url).encode('utf-8'), safe)
And unquote_url()
byłoby być:
def unquote_url(url):
"""Decodes a URL that was encoded using quote_url.
Returns a unicode instance.
"""
return urllib.unquote(url).decode('utf-8')
Jeśli masz zamiar odpowiedzieć na własne pytanie, na przynajmniej poświęć czas, aby wspólnie udzielić bardziej szczegółowej odpowiedzi, aby pomóc innym, którzy natkną się na to samo pytanie. –
@ Chris: Hmm, przepraszam za to. Rozwinąłem odpowiedź i dodałem kod. – Cameron