Oto przykład kodowanie run-length/realizacji dekodowania w Javie:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RunLengthEncoding {
public static String encode(String source) {
StringBuffer dest = new StringBuffer();
for (int i = 0; i < source.length(); i++) {
int runLength = 1;
while (i+1 < source.length() && source.charAt(i) == source.charAt(i+1)) {
runLength++;
i++;
}
dest.append(runLength);
dest.append(source.charAt(i));
}
return dest.toString();
}
public static String decode(String source) {
StringBuffer dest = new StringBuffer();
Pattern pattern = Pattern.compile("[0-9]+|[a-zA-Z]");
Matcher matcher = pattern.matcher(source);
while (matcher.find()) {
int number = Integer.parseInt(matcher.group());
matcher.find();
while (number-- != 0) {
dest.append(matcher.group());
}
}
return dest.toString();
}
public static void main(String[] args) {
String example = "WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWWWWWWWWWWWWWWWWWWWWBWWWWWWWWWWWWWW";
System.out.println(encode(example));
System.out.println(decode("1W1B1W1B1W1B1W1B1W1B1W1B1W1B"));
}
}
Zrobione stąd:
http://rosettacode.org/wiki/Run-length_encoding
(ta strona zawiera równoważne przykłady w 72 różne języki programowania, aby osiągnąć ten sam cel)
Aby osiągnąć to, o co prosisz, użyłbyś "enco" metoda de.
Testowany tutaj: http://www.browxy.com/SubmittedCode/21369
Regex na własną rękę nie jest odpowiednim narzędziem do próby osiągnięcia tego celu.
Escape '.' w ten sposób' \\. '. Zauważ, że 'replaceAll' pobiera ** wyrażenie regularne **, a nie ciąg. ('.' ma specjalne znaczenie w regex) – Maroun
String file = new Scanner (nowy plik (" Jutt.txt ")). useDelimiter (" \\ A "). next(); \t \t String seq = "123456789"; \t String regex = seq.replaceAll ("\\.", "(? = [0-9] ([a-z]))?") + "[0-9] [a-z]"; \t String repl = seq.replaceAll ("\\.", "\\ $$ 0"); \t \t \t \t file = file.replaceAll (repl, regex); Nieco dłuższa część kodu. Muszę skopiować tekst z jednego pliku do drugiego za pomocą kilku modyfikacji, jak powiedziałem wcześniej "Muszę zmienić aaaa na 4a, bbb na 3b i tak dalej". W tej chwili robi się odwrotnie :( – user2408677
Używa łańcucha '1..9' do wygenerowania wyrażenia regularnego:' (? = [1-9] ([az]))? (? = [2-9] ([az]))? (? = [3-9] ([az]))? (? = [4-9] ([az]))? (? = [5-9] ([az])) ? (? = [6-9] ([az]))? (? = [7-9] ([az]))? (? = [8-9] ([az]))? (? = [ 9-9] ([az]))? [0-9] [az] 'i używa tego z zamiennikiem' $ 1 $ 2 $ 3 $ 4 $ 5 $ 6 $ 7 $ 8 $ 9' aby zamienić '4a' na' aaaa'. Działa dla '' aaa'. [0-9] [az] '. Wydaje mi się, że coś, czego nie chcesz zrobić z regexem ... – rvalvik