Question

Je suis dans ma façon de terminer les graphiques pour un papier et décidé ( après une discussion sur stats.stackoverflow ), afin de transmettre le plus d'informations possible, pour créer le graphique suivant qui présente à la fois au premier plan les moyens et en arrière-plan les données brutes: text alt

Cependant, un reste de problème et qui est overplotting. Par exemple, les regards ponctuels marqués comme elle reflète un point de données, mais en fait 5 points de données existe avec la même valeur à cet endroit.
Par conséquent, je voudrais savoir s'il y a une façon de traiter overplotting en utilisant base graph points comme la fonction. Il serait idéal si par exemple, les points respectifs deviennent plus sombres ou plus épais ou ...

manuellement faire est pas une option (trop de graphiques et des points comme celui-ci). En outre, ggplot2 est pas non plus ce que je veux apprendre à faire face à ce problème unique (une des raisons est que je tends à deux axes comme ce qui ne supprted dans ggplot2).


Mise à jour: J'ai écrit une fonction qui crée automatiquement les graphiques ci-dessus et évite overplotting en ajoutant la gigue verticale ou horizontale (ou les deux): check it out!

Cette fonction est désormais disponible raw.means.plot et raw.means.plot2 dans le plotrix paquet (sur CRAN).

Était-ce utile?

La solution

approche standard est d'ajouter un peu de bruit aux données avant le traçage. R a une gigue de fonction () qui fait exactement cela. Vous pouvez l'utiliser pour ajouter le bruit nécessaire aux coordonnées dans votre parcelle. par exemple:

X <- rep(1:10,10)
Z <- as.factor(sample(letters[1:10],100,replace=T))

plot(jitter(as.numeric(Z),factor=0.2),X,xaxt="n")
axis(1,at=1:10,labels=levels(Z))

Autres conseils

En plus sautillement, une autre bonne approche est l'alpha mélange que vous pouvez obtenir (sur les périphériques graphiques supporing il) que le quatrième paramètre de couleur. J'ai fourni un exemple pour « overplotting » de deux histogrammes dans cette question SO .

Une idée supplémentaire pour le problème général de montrer le nombre de points utilise un terrain de tapis (fonction tapis), ce lieux de petites marques de tiques le long de la marge qui peut montrer combien de points Contribute (utiliser encore sautillement ou alpha mélange pour les liens ). Cela permet aux points réels de montrer leurs vraies valeurs plutôt que gigue, mais le tapis peut alors indiquer quelles parties de l'intrigue ont plus de valeurs.

Pour l'exemple tracé sautillement direct ou alpha mélange est probablement mieux, mais dans d'autres cas, le tracé de tapis peut être utile.

Vous pouvez également utiliser sunflowerplot , alors qu'il serait difficile de mettre en œuvre ici. J'utiliser alpha-mélange, comme suggéré Dirk.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top