Mam zestaw danych 2,5 GB, który jest dość duży dla mojej pamięci 4 GB. Zastanawiam się, czy konwersja zmiennych postaci na czynniki pozwoli zaoszczędzić miejsce i czas przetwarzania.Czy konwertowanie kolumn znaków na czynniki oszczędza pamięć?
Wyobrażam sobie, że wewnętrznie czynniki będą przechowywane w postaci liczbowej z tabelą odnośników dla poziomów. Ale nie jestem pewien, jak to działa.
Masz rację co do sposobu czynniki są przechowywane. Ale oszczędność miejsca zależy od liczby poziomów czynników i długości łańcuchów, które chcesz przekonwertować. Możesz również spojrzeć na niektóre duże pakiety danych, takie jak 'ff'. – Justin
Konwersja na czynnik nie spowoduje zaoszczędzenia miejsca, ponieważ znaki są przechowywane w tabeli mieszającej. Konwersja na czynnik może wydłużyć czas przetwarzania - jeśli cokolwiek robisz, to i tak przekształci postać w czynnik - ale to naprawdę zależy od tego, co robisz. –
Wielkie dzięki za jasne wyjaśnienie, Joshua. I dziękuję Justin za wskazanie ff paczki. – AdamNYC