terça-feira, 29 de maio de 2007

Dia 145 - . . .

Como já devem ter percebido, estou um bocadinho atrasado mas só mesmo um bocadinho. Hoje reparei que alguns ficheiros têm linhas repetidas e isto não é de todo bom para as estatísticas. Eliminar linhas repetidas não é uma tarefa assim tão dificil quando se trata de um ficheiro. No meu caso, tenho à volta de 70 ficheiros com uma média de 7000 linhas cada. Just imagine... Para resolver este problema, saquei... (ups!! Este foi legal :P) um programa que faz mesmo o que eu preciso. O problema é que o programa não é assim tão legal e só retira as linhas repetidas em metade do ficheiro. Lá pus a cabecinha a pensar (para variar...). A solução que encontrei foi duplicar o conteudo dos ficheiros ;) O prob é que a coisa leva entre 1 min e 10 min por ficheiro. Ora, vamos lá a contas...

70 ficheiros x 5 min + 1 seca = 350 min e uma grande seca

Sem comentários: