Boa tarde pessoal, estou com um problema e espero que consiga ajuda aqui...
Tenho um banco com 700 linhas e 33 colunas.
Cada coluna representa uma alternativa num questionário. Portanto, tenho alternativa 1 até 33.
A linha representa o respondente, então tenho 700 questionários respondidos.
Este questionário é de múltipla escolha, então o respondente pode assinalar quantas respostas ele quiser.
Tenho o banco mais ou menos assim:
Resp.|.P1.|.P2.|.P3.|.P4.|.P5.|.....|.P33
..1...|..1..|..2..|.....|..4..|......| ... |..33
..2...|.....|..2..|..3..|..4..|..5...| ... |....
..3...|..1..|.....|..3..|..4..|......| ... |..33
..4...|..1..|..2..|..3..|.....|..5...| ... |..33
..5...|......|..2..|..3..|..4..|..5...| ... |..33
Preciso fazer um ranking do 1º ao 20º colocado, do conjunto de dez respostas.
Por exemplo:
1º 1-5-6-10-11-12-20-25-26-28 (250 vezes)
2º 2-3-4-6-7-10-11-12-16-17 (180 vezes)
E assim por diante...
O meu problema é que, combinando 33 10 a 10, tenho mais de 90milhões de combinações possíveis.
Como faço para comparar entre as linhas, e extrair o grupo de dez números que mais aparece?
Estou junto com um professor tentando resolver esta questão há algum tempo, mas não conseguimos nada. Já se tornou mais que um desafio.
Agradeço quem puder ajudar!