Każda funkcja ciągła (która obejmuje większość typowych operacji matematycznych) można również w przybliżeniu ponad ograniczonym przedziale przez wielomian. To, wraz ze stosunkowo prostymi tożsamościami, które zwykle spełniają funkcje matematyczne (takie jak dodawanie praw) i wyszukiwaniem tabel, stanowi podstawę standardowych technik konstruowania szybkich algorytmów aproksymacyjnych (a także podstawą metod o wysokiej dokładności, takich jak stosowane w matematyce systemowej biblioteka).
Seria Taylora jest zwykle złym wyborem; Wielomiany Czebyszewa lub Minimax mają znacznie lepszą charakterystykę błędów dla większości zastosowań obliczeniowych. Standardową techniką dopasowania wielomianów minimax jest użycie algorytmu Remesa, który jest zaimplementowany w wielu komercyjnych programach matematycznych, lub możesz wdrożyć własną implementację w dzień pracy, jeśli wiesz, co robisz.
Dla przypomnienia, „Szybka odwrotność pierwiastka kwadratowego” należy unikać na nowoczesnych procesorach, jak to jest znacznie szybsze użyć zmiennoprzecinkową dyspozycję oszacowanie odwrotność pierwiastka kwadratowego (rsqrtss
/rsqrtps
na SSE, vrsqrte
na neon, vrsqrtefp
w AltiVec). Nawet (nie w przybliżeniu) pierwiastek kwadratowy sprzętu jest dość szybki na obecnych procesorach Intela.
Może dostaniesz również odpowiedzi na ten temat na http://mathoverflow.net – Lucero
Co powiesz na stworzenie wiki? – ATorras
Nie jestem pewien, czy szybki odwrotny root używany w Quakerze jest szybszy w tych dniach niż robienie RSQRTPS, i robi cztery równolegle. Obecnie koszt przenoszenia danych z jednostki FPU do pamięci RAM w celu zarejestrowania, manipulowania, przechowywania i ponownego załadowania do jednostki FPU może być czymś więcej niż tylko wykonaniem FSQRT. – Skizz