Mann–Whitney U com a ferramenta de estatísticas R

Por vezes é necessário comparar 2 data sets independentes para saber qual é o maior. Um algoritmo muito utilizado para isto é o Mann–Whitney U (também conhecido por Mann–Whitney-Wilcoxon). Neste post deixo um script que utiliza 2 ficheiros, cada um com um data set, e que os compara utilizando este algoritmo. Para isto é necessário recorrer a um script que é executado com o R.

Primeiro, um sample de um dos ficheiros de input:

O script está preparado para receber um valor por cada linha e deverão haver 2 destes ficheiros. Depois basta criar o ficheiro wilcox.r que recebe 2 argumentos e os compara utilizando o Mann-Whitney U:

O script deverá ser executado com o seguinte comando, no terminal:

O resultado, caso seja inferior a 0.05, indica que os valores do primeiro ficheiro são maiores que os do segundo ficheiro. Quanto mais perto de 1, menor os valores do primeiro ficheiro são. Quanto mais perto de 0.5, mais os valores são equivalentes.