Mam SQLite bazę danych zawierającą następujące rodzaje schematu:Generowanie gęstej matrycy z rozrzedzony matrycy w python numpy
termcount(doc_num, term , count)
Tabela ta zawiera terminy z ich liczbą w dokumencie. jak
(doc1 , term1 ,12)
(doc1, term 22, 2)
.
.
(docn,term1 , 10)
Macierz ta może być uznana za rzadkie matrycy jak każdy dokumenty zawiera bardzo mało terminy, które mają niezerową wartość.
Jak utworzyć gęstą matrycę z tej rzadkiej macierzy za pomocą numpy, ponieważ muszę obliczyć podobieństwo między dokumentami przy użyciu podobieństwa cosinusów.
Ta gęsta matryca będzie wyglądać jak tabela, która ma docid jako pierwsza kolumna, a wszystkie terminy będą wymienione jako pierwszy wiersz. Pozostałe komórki będą zawierać liczby.