Jak wykryć, czy procesor ma dobrą obsługę POPCNT?

Mam dwie wersje fast newline-counting routine. Jeden działa na starszym sprzęcie, a drugi działa znacznie szybciej za pomocą instrukcji POPCNT, która jest dostępna na nowszym sprzęcie (np. Procesory Intel 6. generacji).Jak wykryć, czy procesor ma dobrą obsługę POPCNT?

Teraz chciałbym użyć najlepszej wersji dla każdego procesora — jak mogę się dowiedzieć, czy ma on wysoką wydajność POPCNT?

Źródło

2016-09-23 llogiq

Nie powinien ["count_ones'] (https://doc.rust-lang.org/std/primitive.usize.html#method.count_ones) zrobić to automatycznie? – starblue

@starblue może być inny. Użycie opcji 'count_ones' pozwoli na optymalizację LLVM dla ** docelowego ** komputera, aby można było usunąć wszelkie decyzje dotyczące środowiska wykonawczego. Jeśli skompilowany kod musi być w stanie przełączać się w czasie wykonywania, nadal może być konieczne zapytanie do bieżącego procesora. – Shepmaster

Można zrobić like @kobrien said, czy można przyjąć bardziej cywilizowane podejście - z cpuid crate.

Aby to zrobić, dodaj go do swojej Cargo.toml a następnie, w celu sprawdzenia dostępności POPCNT zrobić

extern crate cpuid; 

fn have_popcnt() -> Option<bool> { 
    cpuid::identify().ok().map(|ci| ci.has_feature(cpuid::CpuFeature::POPCNT)) 
}

Funkcja have_popcnt() powróci None jeśli procesor nie obsługuje instrukcji CPUID lub Some(hp), gdzie hp określa dostępność POPCNT na tym.

Źródło

2016-09-23 23:26:33

Wykonaj instrukcję cpuid. Sprawdź bit 23 ekx.

https://en.wikipedia.org/wiki/CPUID

Źródło

2016-09-23 23:12:32 kobrien

Są ku temu skrzynki, takie jak mój [amorek] (https://crates.io/crates/cupid). – Shepmaster

Jak wykryć, czy procesor ma dobrą obsługę POPCNT?

Odpowiedz

Powiązane problemy