2016-12-19 22 views
5

Mam następujące zapytanie, które okazuje się bardzo kosztowne i trwa 6-8 sekund. Patrząc na plan wykonania, koszt wynosi 79% w operacji SORT. Czy mogę tu uzyskać jakąkolwiek poprawę?Szyjka butelki na operację SORT

IMG

SELECT 
     A.StageName, 
     C.Month, 
     C.MonthName as Label, 
     C.Year, 
     isnull(A.Average,0) as Data 
    FROM 
    ( 
     SELECT 
      S.StageName, 
      MONTH(TimeIn) as MonthNumber, 
      DATENAME(MONTH,TimeIn) as Month, 
      YEAR(TimeIn) as Year, 
      ISNULL(AVG(DATEDIFF(mi,TimeIn,isnull(TimeOut,@TodayDate))),0) as Average 
     FROM 
      VisitMovement VM 
     INNER JOIN Stage S on 
      VM.StageID = S.StageID 
     WHERE 
      (VM.TimeIn >= @StartDate AND 
      VM.TimeIn < DATEADD (d,1,@EndDate)) AND 
      (VM.TimeOut < DATEADD (d,1,@EndDate) OR VM.TimeOut IS NULL) 
     GROUP BY 
      S.StageNumber, 
      S.StageName, 
      MONTH(TimeIn), 
      DATENAME(MONTH,TimeIn), 
      YEAR(TimeIn) 
    ) A 
    RIGHT JOIN (select distinct Month,MonthName,Year from Calendar WHERE DATE >= @StartDate AND DATE < DATEADD (d,1,@EndDate)) C on 
     A.MonthNumber = C.Month and 
     A.Month = C.MonthName and 
     A.Year = C.Year 
    GROUP BY 
     A.StageName, 
     C.Month, 
     C.MonthName, 
     C.Year, 
     A.Average 
    ORDER BY 
     CASE WHEN @Ordering = 'asc' THEN C.Year   END ASC, 
     CASE WHEN @Ordering = 'asc' THEN C.Month   END ASC, 
     CASE WHEN @Ordering = 'asc' THEN A.StageName  END ASC, 
     CASE WHEN @Ordering = 'desc' THEN C.Year   END DESC, 
     CASE WHEN @Ordering = 'desc' THEN C.Month   END DESC, 
     CASE WHEN @Ordering = 'desc' THEN A.StageName  END DESC 
+0

Najdroższy sort w twoim planie dzieje się z powodu iteratora 'Stream Aggregate', ponieważ ten iterator oczekuje posortowanych danych wejściowych, a iterator' Stream Aggregate' jest tam ze względu na twoją klauzulę 'inner group by'. Postaraj się uzyskać unikalne wiersze bez użycia klauzuli "Grupuj według", które spowoduje opuszczenie 'Stream Aggregate' i sortowanie również zniknie. –

+0

Dzięki @ M.Ali - to niestety niestety, ponieważ muszę zgrupować wszystkie rekordy w tabeli, aby obliczyć ogólną średnią. – Philip

Odpowiedz

0

Chociaż rozumiem, nie można pozbyć się GROUP BY na różnych kolumn w sub-zapytania, można łatwiej dla systemu.

Obecnie masz

S.StageNumber, 
S.StageName, 
MONTH(TimeIn), 
DATENAME(MONTH,TimeIn), 
YEAR(TimeIn) 

co chyba jest dość dużo danych, aby przejść. Pozwól mi zrobić jakieś domysły:

S.StageNumber, -- int, 4 bytes 
S.StageName, -- string, 20 bytes 
MONTH(TimeIn), -- int, 4 bytes 
DATENAME(MONTH,TimeIn), -- string 5 bytes 
YEAR(TimeIn) -- int, 4 byte 

Teraz, istnieją pewne zależności:

  • Jeśli znasz miesiąca (liczba), to również teraz nazwa nim
  • jestem zgadywanie, że parametr StageName + StageNumber jest unikatowy i bezpośrednio powiązany z identyfikatorem StageID. Jeśli nie, być może będziesz musiał GROUP BY jeszcze raz w zewnętrznej warstwie.

To przyniesie nam

S.StageID, -- int, 4 bytes 
MONTH(TimeIn), -- int, 4 bytes 
YEAR(TimeIn) -- int, 4 byte 

Oznacza to, że sortowanie za GROUP BY musi przebiegać przez zaledwie 12 bajtów na płycie zamiast 37 bajtów na rekord to było wcześniej, a numery rodzaj dość nieco szybciej niż ciągi znaków (np. ze względu na duże/małe litery, akcenty, itp.)

Próbowałem przepisać zapytanie odpowiednio (Bez przeszkód!). Przesłałem również informacje o pobraniu Miesiąca do osobnej tabeli temp, co powinno nieco pomóc Optymalizatorowi zapytań.

SELECT DISTINCT Month,MonthName,Year 
    INTO #dates 
    FROM Calendar 
WHERE DATE >= @StartDate AND DATE < DATEADD (d,1,@EndDate) 

CREATE UNIQUE CLUSTERED INDEX uq0_#dates ON #dates (Month,Year) 

SELECT 
     A.StageName, 
     C.Month, 
     C.MonthName as Label, 
     C.Year, 
     isnull(A.Average,0) as Data 
    FROM 
    ( 
     SELECT S.StageName, 
       MonthNumber, 
       Year, 
       Average 
      FROM ( 
        SELECT VM.StageID, 
         MONTH(TimeIn) as MonthNumber, 
         YEAR(TimeIn) as Year, 
         ISNULL(AVG(DATEDIFF(mi,TimeIn,isnull(TimeOut,@TodayDate))),0) as Average 
        FROM 
         VisitMovement VM 
        WHERE 
         (VM.TimeIn >= @StartDate AND 
         VM.TimeIn < DATEADD (d,1,@EndDate)) AND 
         (VM.TimeOut < DATEADD (d,1,@EndDate) OR VM.TimeOut IS NULL) 
        GROUP BY 
         VM.StageID, 
         MONTH(TimeIn), 
         YEAR(TimeIn) 
       ) grp 
      JOIN Stage S 
      ON S.StageID = grp.StageID 
     ) 
    ) A 
    RIGHT OUTER JOIN #dates C 
    on 
     A.MonthNumber = C.Month and 
     -- A.Month = C.MonthName and 
     A.Year = C.Year 
    ORDER BY 
     CASE WHEN @Ordering = 'asc' THEN C.Year   END ASC, 
     CASE WHEN @Ordering = 'asc' THEN C.Month   END ASC, 
     CASE WHEN @Ordering = 'asc' THEN A.StageName  END ASC, 
     CASE WHEN @Ordering = 'desc' THEN C.Year   END DESC, 
     CASE WHEN @Ordering = 'desc' THEN C.Month   END DESC, 
     CASE WHEN @Ordering = 'desc' THEN A.StageName  END DESC 

Mam nadzieję, że to pomoże.

+0

Wiele przeprosin za opóźnioną odpowiedź @deroby.Nie było mnie w święta Bożego Narodzenia/Nowego Roku. Dziękuję za rozwiązanie i Szczęśliwego Nowego Roku :) – Philip

0

Ponieważ order by musi ocenić każdy wiersz, nie sądzę, można go optymalnie wykorzystać indeksów. Zastąpienie order by z row_number() domyślnym sortowaniem i odwróceniem tylko raz, powinno przynajmniej zapobiec wielokrotnym ocenom @Ordering dla pojedynczego wiersza.

W poniższym pseudo kodzie pierwotne zapytanie jest umieszczane na CTE. Row_number określa rosnąco sortowania i poniżej CTE kolejność jest odwrotna, jeśli potrzebne:

;with cte as 
(
    SELECT 
     A.StageName, 
     C.Month, 
     ..., 
     row_number() over (order by C.Year,C.Month,A.StageName) sortOrder 
    FROM 
     ...rest of the query, excluding the order by 
) 
select * --or list the columns without the sortOrder 
from cte 
order by sortOrder * case @Ordering when 'desc' then -1 else 1 end 
+0

Dzięki za to @ Me.Name - doceń tę radę. Korzystanie z metody cte sprawia jednak, że zapytanie jest jeszcze wolniejsze. W podejściu CTE umieszcza także żółty znak wyjaśniający u góry operacji Sortowanie. – Philip

Powiązane problemy