Mój prawdziwy problem dotyczy nagrywania, które z bardzo dużej liczby produktów antywirusowych zgadzają się, że dana próbka należy do danej rodziny antywirusowej. Baza danych zawiera miliony próbek, a na każdą próbkę głosuje kilkadziesiąt produktów antywirusowych. Chcę zadać pytanie typu "Dla złośliwego oprogramowania zawierającego nazwę" XYZ ", którego próbka miała najwięcej głosów, i którzy dostawcy głosowali na nią?" i uzyskać wyniki takie jak:Crosstab z dużą lub nieokreśloną liczbą kategorii
"BadBadVirus"
V1 V2 V3 V4 V5 V6 V7
Sample 1 - 4 votes 1 0 1 0 0 1 1
Sample 2 - 5 votes 1 0 1 0 1 1 1
Sample 3 - 5 votes 1 0 1 0 1 1 1
total 14 3 3 2 3 3
który mógłby zostać użyty do mnie powiedzieć, że sprzedawca 2 i 4 albo sprzedawca nie wiem jak wykryć tego szkodliwego oprogramowania, albo że nazwać to coś innego.
Postaram się uogólnić moje pytanie, chociaż mam nadzieję, że nie zepsułem twojej zdolności, by mi pomóc. Załóżmy, że mam pięciu wyborców (Alex, Bob, Carol, Dave, Ed), którzy zostali poproszeni o obejrzenie pięciu zdjęć (P1, P2, P3, P4, P5) i zdecydować, co jest "głównym tematem" zdjęcia. W naszym przykładzie zakładamy, że ograniczają się one do "kotów", "psów" lub "koni". Nie każdy wyborca głosuje na każdą rzecz.
dane znajdują się w bazie danych w tej formie:
Photo, Voter, Decision
(1, 'Alex', 'Cat')
(1, 'Bob', 'Dog')
(1, 'Carol', 'Cat')
(1, 'Dave', 'Cat')
(1, 'Ed', 'Cat')
(2, 'Alex', 'Cat')
(2, 'Bob', 'Dog')
(2, 'Carol', 'Cat')
(2, 'Dave', 'Cat')
(2, 'Ed', 'Dog')
(3, 'Alex', 'Horse')
(3, 'Bob', 'Horse')
(3, 'Carol', 'Dog')
(3, 'Dave', 'Horse')
(3, 'Ed', 'Horse')
(4, 'Alex', 'Horse')
(4, 'Bob', 'Horse')
(4, 'Carol', 'Cat')
(4, 'Dave', 'Horse')
(4, 'Ed', 'Horse')
(5, 'Alex', 'Dog')
(5, 'Bob', 'Cat')
(5, 'Carol', 'Cat')
(5, 'Dave', 'Cat')
(5, 'Ed', 'Cat')
Celem jest, że biorąc pod tematem zdjęcia szukamy, chcielibyśmy wiedzieć, jak wielu wyborców, że to było głównym punktem to zdjęcie, ale także wymień to, KTÓRZY GŁOSIŚMY.
Query for: "Cat"
Total Alex Bob Carol Dave Ed
1 - 4 1 0 1 1 1
2 - 3 1 0 1 1 0
3 - 0 0 0 0 0 0
4 - 1 0 0 1 0 0
5 - 4 0 1 1 1 1
------------------------------------
total 12 2 1 4 3 2
Query for: "Dog"
Total Alex Bob Carol Dave Ed
1 - 1 0 1 0 0 0
2 - 2 0 1 0 0 1
3 - 1 0 0 1 0 0
4 - 0 0 0 0 0 0
5 - 1 1 0 0 0 0
------------------------------------
total 5 1 2 1 0 1
Czy mogę coś zrobić z danymi w formacie, który mam w nim przechowywany?
Mam trudności z uzyskaniem zapytania, które to robi - chociaż jest to dość proste, aby zrzucić dane, a następnie napisać program, który to zrobi, naprawdę chciałbym móc to zrobić W BAZIE DANYM, jeśli mogą.
Dzięki za wszelkie sugestie.
@ user1761471 Updated odpowiedź z anonimowy blok kodu –
Dziękuję bardzo, Clodoaldo! Liczba głosujących nie jest niemożliwa do opanowania (44), ale liczba rzeczy, nad którymi głosują jest ogromna (3 miliony) Wrócę z opinią, co stanie się wkrótce. – user1761471