Mam duży plik csv do odczytu w ramce danych. Dane w pliku csv pochodzą z wielu witryn internetowych reprezentujących informacje o użytkowniku. Na przykład tutaj jest struktura ramki danych.Dodaj kolumnę indeksu (numerycznego identyfikatora) do dużej ramki danych
user_id, number_of_logins, number_of_images, web
001, 34, 3, aa.com
002, 4, 4, aa.com
034, 3, 3, aa.com
001, 12, 4, bb.com
002, 1, 3, bb.com
034, 2, 2, cc.com
jak widać po wprowadzeniu danych do ramki danych id_użytkownika nie jest już unikalnym identyfikatorem, co powoduje całą analizę. Próbuję dodać inne kolumny przed user_id
, która jest podobna do "generated_uid"
i prawie używać indeksu data.frame
do wypełnienia przez tę kolumnę. Jaki jest najlepszy sposób, aby to osiągnąć.
Prostym sposobem jest dodanie nowej kolumny z rosnącymi liczbami: 'data.frame $ generated_uid <- 1: nrow (data.frame)' –