2010-04-02 16 views
7

mam bardzo długie sekwencje liczb całkowitych, który wyglądał następująco (dowolnej długości!):Kodowanie/kompresji sekwencji powtarzających się liczb całkowitych

0000000001110002220033333 

Teraz muszę trochę algorytm przekonwertować ten ciąg do czegoś sprężonego jak

a9b3a3c3a2d5 

Co oznacza "9 razy, potem b 3 razy, potem 3 razy" i tak dalej, gdzie "a" oznacza 0, "b" dla 1, "c" dla 2 i "d" dla 3.

Jak byś to zrobił? Jak dotąd nic mi nie przychodziło do głowy i nie miałem szczęścia w Google, ponieważ tak naprawdę nie wiedziałem, czego szukać. Jak nazywa się ten rodzaj kodowania/kompresji?

PS: Mam zamiar zrobić kodowanie z PHP i dekodowania w JavaScript.

Edytuj: Dziękuję wszystkim!

skończyło się z tą funkcją kodowania:

protected function numStringToRle($s){   
     $rle = ''; 
     $count = 1; 
     $len = strlen($s); 
     for($i = 0; $i < $len; $i++){ 
      if($i != $len && isset($s[$i+1]) && $s[$i] == $s[$i+1]){ 
       $count++;     
      } else { 
       $rle .= chr($s[$i] + 97).($count == 1 ? '' : $count);         
       $count = 1; 
      } 
     } 
     return $rle;    
} 

I do dekodowania:

var decodeCoords = function(str) { 

    str = str.replace(/(.)(\d+)/g, function(_, x, n) { 
     return new Array(parseInt(n, 10) + 1).join(x); 
    }); 

    return str. 
    replace(/a/g, '0'). 
    replace(/b/g, '1'). 
    replace(/c/g, '2'). 
    replace(/d/g, '3');  
}; 
+1

Co dokładnie używasz to wszystko? Czy na pewno nie możesz po prostu skompresować go za pomocą Gzip? http: // stackoverflow.com/questions/294297/javascript-implementation-of-gzip To będzie bardziej efektywny czas i przestrzeń, a to już zrobione. – ryeguy

+0

gzip nie jest opcją, ponieważ muszę ją odkodować za pomocą javascript. Używam go jako rodzaju maski bitowej do gry 2d. – Alex

Odpowiedz

7

to nazywa Run Length Encoding

Podstawowe koder PHP:

function numStringToRle($s){ 
    $rle = ''; 
    $count = 1; 
    $len = strlen($s); 
    for ($i = 0; $i < $len; $i++){ 
     if ($i != $len && $s[$i] == $s[$i+1]){ 
      $count++;     
     }else{ 
      $rle .= chr($s[$i] + 97).$count;  
      $count = 1; 
     } 
    } 
    return $rle; 
} 

Ostrzegamy będzie preform źle wystawia sznurkiem jak

123456789123456789 

Jeśli jechaliśmy obsługi ciąg znaków, który może mieć wiele indywidualnych pojedynczych znaków można byłoby lepiej, aby dodać trochę złożoności i nie pisać długość przebiegu, jeśli długość przebiegu wynosi 1.

//change 
$rle .= chr($s[$i] + 97).$count;  

//to 
$rle .= chr($s[$i] + 97).($count == 1 ? '' : $count); 

//or 
$rle .= chr($s[$i] + 97) 
if ($count != 1){ 
    $rle .= $count; 
} 
+0

Działa jak urok, thx! – Alex

+0

Szukałem nazwy tego algorytmu. Dzięki! – Jack

2

Oto naiwna realizacja tego, co chcesz.

$toEncode = '0000000001110002220033333'; 
$currentChar = '-1'; 
$length = strlen($toEncode); 
$encoded = ''; 
$currentNbrChar = 0; 
for($i = 0; $i < $length; $i++){ 
    if($toEncode[$i] != $currentChar){ 
    if($currentChar != '-1'){ 
     $encoded .= chr(97 + $currentChar).$currentNbrChar; 
    } 
    $currentNbrChar = 0; 
    $currentChar = $toEncode[$i]; 
    } 
    $currentNbrChar ++; 
} 
if($currentChar != '-1'){ 
    $encoded .= chr(97 + $currentChar).$currentNbrChar; 
} 
echo $encoded; 
+0

Dzięki! To działa idealnie. – Alex

2

Oto krótsza wersja:

function smush(str) { 
    return str.replace(/((.)\2*)/g, function(_, w, x) { 
    return x + w.length; 
    }); 
} 

edit oh widzę chcesz kodować z php; przepraszam, nie wiem tego. Oto dekoder w podobnym duchu:

function unsmush(str) { 
    return str.replace(/(.)(\d+)/g, function(_, x, n) { 
    return new Array(parseInt(n, 10) + 1).join(x); 
    }); 
} 
0

Wystarczy FYI, można prawdopodobnie gzip danych oraz przeglądania automatycznie rozpakuj go. W przypadku większości implementacji będzie działać lepiej niż RLE. Ale oczywiście mniej zabawy.

0
$str="0000000001110002220033333"; 

//$c will count the number of occurances. 

$c=1; 

$lastInt=substr($str,0,1); 

$str=substr($str,1); 

$resultStr=''; 

$loopEnd=strlen($str); 


for($i=1; $i<=$loopEnd+1;$i++) 

{ 

    $nowInt=substr($str,0,1); 
    if($lastInt==$nowInt) 
    { 
     $c++; 
     $str=substr($str,1); 
    } 
    else 
    { 
     $char=chr((int)$lastInt + 97); 
     $resultStr=$resultStr.$char.$c; 
     $str=substr($str,1); 
     $c=1; 
     $lastInt=$nowInt; 
    } 
} 

// we use if condition since for loop will not take the last integer if it repeats. 

if($c>1) 
{ 

$char=chr((int)$lastInt + 97); 

$resultStr=$resultStr.$char.$c; 

} 

echo $resultStr; 
0
function compress($str) { 
$strArr = str_split($str.'0'); 
$count = 0; 
$resStr = ''; 
$strCheck = $strArr[0]; 
foreach($strArr as $key => $value) 
{ 
    if($strCheck == $value) 
    { 
     $count++; 
    } 
    else 
    { 
     if($count == 1) 
     { 
      $strCheck = $value; 
      $resStr .= $strArr[$key-1]; 
      $count=1; 
     } 
     elseif($count == 2) 
     { 
      $strCheck = $value; 
      $resStr .= $strArr[$key-1].$strArr[$key-1]; 
      $count=1; 
     } 
     else 
     { 
      $strCheck = $value; 
      $resStr .= $strArr[$key-1].$count; 
      $count=1; 
     } 
    } 

} 
return $resStr; 

}

Powiązane problemy