2010-08-10 6 views
10

Generuję pliki, pozwala wywoływać je pliki .dwrf, które zawierają znaczną ilość danych. Obecnie eksportujemy je do .CSV, a powstałe pliki są duże (2 GB +). Chciałbym wykreślić proces eksportu i sprawić, że zawartość pliku .dwrf będzie możliwa do sprawdzenia bezpośrednio z Excela lub innych aplikacji.Jak przekształcić płaski plik danych w źródło danych, które można wyszukać

Co chciałbym zrobić, to napisać narzędzie/usługę - nazwijmy to dwrfMiner - aby wyodrębnić dane z pliku i przekazać je jako źródło danych i połączyć dwrfMiner z plikami .dwrf w pewien sposób, aby program Excel je rozpoznał jako zewnętrzne źródło danych.

Wszelkie pomysły?

+0

Czy chcesz zapytać ręcznie, programowo lub jedno i drugie? – mcandre

+0

Obie. Chciałbym interfejs używany przez użytkowników Excel (najpierw) i przez inne procesy później. – dwarFish

+0

Jaki jest format pliku DWRF? W jaki sposób dane są uporządkowane w pliku? – Lazarus

Odpowiedz

3

Pisząc sterownik ODBC za to chyba przesada, czy format plików, które pracują z znany jest z góry i nie jest zbyt trudne do przetłumaczenia (IT brzmi jak nie biorąc pod uwagę, że już tworzysz CSV), wtedy używanie ODN DSN brzmi jak twój najlepszy zakład.

Istnieje bardzo dobry wybór sterowników ODBC już wbudowanych w Windows (.txt dla wielu popularnych formatów.

Jeśli rozmiar istniejącego formatu, do którego eksportujesz, jest zbyt uciążliwy (CSV), to punktem logicznym do rozpoczęcia jest przekształcenie danych w coś bardziej przestrzennego, które obsługuje ODBC.

W przeciwnym razie ostatnią opcją jest opcja przeskalowania (zapisywanie sterownika ODBC).

+1

(+1); Aby zrobić to jeszcze dalej, aby móc projektować przyszłe oprogramowanie, użytkownik (dwarFish) może rozważyć takie rozważania przed zdefiniowaniem formatu wyjściowego. – chiccodoro

1

Program Excel może wysyłać zapytania do zewnętrznych danych, ale należy pamiętać, że Excel (wszystkie wersje) mają sztywne limity liczby wierszy, które mogą wyświetlać, w każdym zeszytach. Myślę, że w Excelu 2003 limit wynosi ~ 65k. Jest wyższy w innych wersjach.

Zobacz moje pytanie: reporting tool/viewer for large datasets (i miałem znacznie mniej niż > 2 GB).

+0

Limit wierszy programu Excel 2007 wynosi 1 048 576 wierszy: w poprzednich wersjach limit wynosił 65 536 wierszy ... na arkusz roboczy –

0

bym wyjść gcc i napisać sobie pełny sterownik ODBC dla niego. Następnie możesz usiąść i korzystać z SQL.

Wiesz, jeśli się nudzisz. ;)

0

użycie sterownika ODBC z wielowątkowości

Powiązane problemy