2012-07-13 15 views
5

Chcę przetestować algorytm z mojego gatunku muzycznego w publicznym zbiorze danych, aby porównać go z innymi algorytmami z preexisted. W przypadku MIREX wszystkie dane nie są dostępne. Zauważyłem, że zbiór danych GTZAN jest dostępny w linku (marsyas.info/download/data_sets) Ale teraz nie jest dostępny dla mnie.Zestaw danych gatunku muzycznego GTZAN

Czy wiesz, jak mogę uzyskać te dane? Ponieważ używam innej funkcji niż MFCC, więc potrzebuję adnotacji gatunku, jak również muzyki.

Z góry dziękuję.

Odpowiedz

1

Poszukuję również takiego testu porównawczego.
znajdę to na papierze o nazwie „Od dźwięku do«rozsądku»poprzez wychwytywanie cech i uczenia maszynowego - Wyprowadzenie wysokiego szczebla deskryptorów do charakteryzowania Music”:

Istnieją pewne wysiłki obecnie podejmowane w muzyce Społeczność pobierania informacji do kompilowania dużych repozytoriów z muzyki z etykietą, która może zostać udostępniona wszystkim zainteresowanym badaczom bez problemów związanych z prawami autorskimi. Na uwagę zasługują Masa taka: Goto's Music Database Database (http://staff.aist.go.jp/m.goto/RWC-MDB), IMIRSEL (Laboratorium oceny międzynarodowego systemu wyszukiwania informacji muzycznych Laboratorium) University of Illinois w Urbana-Champaign (http://www.music-ir.org/evaluation - patrz także [12]) oraz nowej FreeSound Initiative (http://freesound.iua.upf.edu) .

, ale nie mogłem znaleźć niczego przydatnego od nich. Procedura uzyskania kopii pierwszej wspomnianej bazy danych jest opisana jako here, ale wydaje się dość wyrafinowana!

1

Wygląda na to, że mógłbyś chcieć Million Songs Dataset, który ma milion piosenek, z funkcjami audio, znacznikami, tekstami i tak dalej, ze słowami Echonest i Labrosa. Oczywiście zakłada się, że pracujesz z metadanych muzycznych i transkrypcji.

Jeśli szukasz surowego audio ... to już inna sprawa. Nie wiem, czy chcesz publikować, w którym to przypadku prawo własności intelektualnej może być ważniejszym czynnikiem. Ale do prywatnego testowania podejrzewam, że można po prostu użyć plików z własnej biblioteki muzycznej (np. Pliki do pobrania iTunes już mają tag gatunku, aby przetestować swój algorytm).

Nota prawna: Nie jestem prawnikiem. Skorzystaj z mojej porady prawnej na własne ryzyko.

+0

Nie sądzę, że MSD ma teksty. – pratnala

6

EDYTOWANIE: wydaje się, że strona Marsyas jest hostowana pod numerem marsyasweb.appspot.com, a linki do bazy GTZAN można znaleźć na podstronie data sets.

Szukałem również zestawu danych GTZAN dla mojego projektu uniwersyteckiego i dowiedziałem się, że http://marsyas.info jest wyłączony, więc użyłem google web cache for marsyas.info/download/data_sets (sprawdź więcej informacji). Na szczęście zestawy danych GTZAN są hostowane pod numerem http://opihi.cs.uvic.ca, a Ty możesz download them!

jednak zdawać sobie sprawę z licencji przed użyciem DataSetów (informacje z pamięci podręcznej Marsjaszem pobrać strony):

Ten zestaw danych został użyty do znanego papieru w klasyfikacji gatunku „Muzyczne klasyfikację gatunku sygnałów audio” przez G Tzanetakis i P.Gotuj w transakcjach IEEE na przetwarzanie dźwięku i mowy 2002.

Niestety, baza danych została zebrana stopniowo i bardzo wcześnie w moich badaniach, więc nie mam tytułów (i oczywiście żadnych praw autorskich itp.). Pliki zostały zebrane w latach 2000-2001 z różnych źródeł, w tym osobistych płyt CD, radia, nagrań mikrofonowych, w celu reprezentowania różnorodnych warunków nagrywania. Niemniej jednak udostępniam go badaczom na życzenie głównie w celach porównawczych itp. Prosimy o kontakt z George Tzanetakis ([email protected]), jeśli zamierzasz publikować wyniki eksperymentalne z użyciem tego zbioru danych.

Zestaw danych składa się z 1000 ścieżek audio, każda o długości 30 sekund. Zawiera 10 gatunków, z których każdy reprezentowany jest przez 100 ścieżek. Ścieżkami są wszystkie 16-bitowe pliki audio w rozdzielczości 22050Hz w formacie .wav.

Być może zainteresują Cię również inne zestawy danych, takie jak Magnatagatune - http://tagatune.org/Magnatagatune.html.

Powiązane problemy