2011-11-12 12 views
5

Zajmuję się profilowaniem kodu C#. Poniższa metoda jest jedną z najdroższych. Na potrzeby tego pytania przyjmijmy, że mikrooptymalizacja jest słuszną czynnością. Czy istnieje podejście do poprawy wydajności tej metody?Optymalizacja fragmentu kodu C#

Zmiana parametru wejściowego na p na ulong[] spowodowałaby nieefektywność makr.

static ulong Fetch64(byte[] p, int ofs = 0) 
{ 
    unchecked 
    { 
     ulong result = p[0 + ofs] + 
      ((ulong) p[1 + ofs] << 8) + 
      ((ulong) p[2 + ofs] << 16) + 
      ((ulong) p[3 + ofs] << 24) + 
      ((ulong) p[4 + ofs] << 32) + 
      ((ulong) p[5 + ofs] << 40) + 
      ((ulong) p[6 + ofs] << 48) + 
      ((ulong) p[7 + ofs] << 56); 
     return result; 
    } 
} 
+3

Wygląda BitConverter.ToInt64 - http://msdn.microsoft.com/en-us/library/system.bitconverter.toint64.aspx? –

+0

Odczytywanie i przesuwanie kilku bajtów - czy to uczciwie drogie? Jestem pewien, że nazywasz to dużo, ale byłbym zaskoczony, gdyby kompilator mógł się pomylić z tym – Rup

+1

@Alexei ToUInt64, ale tak. Jeśli zamiast tego chciałeś użyć tego, opublikuj to jako odpowiedź? (Czy Eric chce zoptymalizować BitConverter?) – Rup

Odpowiedz

5

Dlaczego nie używać BitConvertera? Muszę uwierzyć, że Microsoft spędził jakiś czas na dostrojeniu tego kodu. Plus zajmuje się problemami endian.

Oto jak BitConverter okazuje byte [] do długiej/ulong (Ulong konwertuje go jako podpisany, a następnie rzuca go do unsigned):

[SecuritySafeCritical] 
public static unsafe long ToInt64(byte[] value, int startIndex) 
{ 
    if (value == null) 
    { 
    ThrowHelper.ThrowArgumentNullException(ExceptionArgument.value); 
    } 
    if (((ulong) startIndex) >= value.Length) 
    { 
    ThrowHelper.ThrowArgumentOutOfRangeException(ExceptionArgument.startIndex, ExceptionResource.ArgumentOutOfRange_Index); 
    } 
    if (startIndex > (value.Length - 8)) 
    { 
    ThrowHelper.ThrowArgumentException(ExceptionResource.Arg_ArrayPlusOffTooSmall); 
    } 
    fixed (byte* numRef = &(value[startIndex])) 
    { 
    if ((startIndex % 8) == 0) 
    { 
     return *(((long*) numRef)); 
    } 
    if (IsLittleEndian) 
    { 
     int num = ((numRef[0] | (numRef[1] << 8)) | (numRef[2] << 0x10)) | (numRef[3] << 0x18); 
     int num2 = ((numRef[4] | (numRef[5] << 8)) | (numRef[6] << 0x10)) | (numRef[7] << 0x18); 
     return (((long) ((ulong) num)) | (num2 << 0x20)); 
    } 
    int num3 = (((numRef[0] << 0x18) | (numRef[1] << 0x10)) | (numRef[2] << 8)) | numRef[3]; 
    int num4 = (((numRef[4] << 0x18) | (numRef[5] << 0x10)) | (numRef[6] << 8)) | numRef[7]; 
    return (((long) ((ulong) num4)) | (num3 << 0x20)); 
    } 
} 

Podejrzewam, że robi konwersję jednego 32-bitowego słowa w Czas jest na wydajność 32-bitową. Brak rejestrów 64-bitowych na 32-bitowym procesorze oznacza, że ​​obsługa 64-bitowych int jest o wiele droższa.

Jeśli wiesz na pewno, że kierujesz się na sprzęt 64-bitowy, szybsza może być konwersja za jednym zamachem.

+0

Warto również zauważyć, że używa się niebezpiecznego kodu w celu zwiększenia wydajności; wygląda na to, że metoda BCL jest najlepsza. –

+0

D'oh! Użył BitConvertera w innym kontekście i nie pomyślał o tym. BTW, ta optymalizacja poprawiła ogólną wydajność mojego C# portu CityHash o 30% (dzięki czemu jest teraz 28% szybszy niż wersja C++, z której portowałem). –

1

Dla porównania, Microsoft .NET 4.0 BitConverter.ToInt64 (Shared Source Initiative w http://referencesource.microsoft.com/netframework.aspx):

// Converts an array of bytes into a long. 
    [System.Security.SecuritySafeCritical] // auto-generated 
    public static unsafe long ToInt64 (byte[] value, int startIndex) { 
     if(value == null) { 
      ThrowHelper.ThrowArgumentNullException(ExceptionArgument.value); 
     } 

     if ((uint) startIndex >= value.Length) { 
      ThrowHelper.ThrowArgumentOutOfRangeException(ExceptionArgument.startIndex, ExceptionResource.ArgumentOutOfRange_Index); 
     } 

     if (startIndex > value.Length -8) { 
      ThrowHelper.ThrowArgumentException(ExceptionResource.Arg_ArrayPlusOffTooSmall); 
     } 

     fixed(byte * pbyte = &value[startIndex]) { 
      if(startIndex % 8 == 0) { // data is aligned 
       return *((long *) pbyte); 
      } 
      else { 
       if(IsLittleEndian) { 
        int i1 = (*pbyte) | (*(pbyte + 1) << 8) | (*(pbyte + 2) << 16) | (*(pbyte + 3) << 24); 
        int i2 = (*(pbyte+4)) | (*(pbyte + 5) << 8) | (*(pbyte + 6) << 16) | (*(pbyte + 7) << 24); 
        return (uint)i1 | ((long)i2 << 32); 
       } 
       else { 
        int i1 = (*pbyte << 24) | (*(pbyte + 1) << 16) | (*(pbyte + 2) << 8) | (*(pbyte + 3)); 
        int i2 = (*(pbyte+4) << 24) | (*(pbyte + 5) << 16) | (*(pbyte + 6) << 8) | (*(pbyte + 7)); 
        return (uint)i2 | ((long)i1 << 32); 
       } 
      } 
     } 
    } 
1

Dlaczego nie pójść niebezpieczne?

unsafe static ulong Fetch64(byte[] p, int ofs = 0) 
{ 
    fixed (byte* bp = p) 
    { 
    return *((ulong*)(bp + ofs)); 
    } 
}