左右対称で単峰な分布であれば,平均値,中央値,最頻値は一致しますが,歪んでいると三つはズレます。
このことを正規分布とカイ二乗分布で図示しました。
library(tidyverse)
## ─ Attaching packages ──────────────────── tidyverse 1.3.1 ─
## ✓ ggplot2 3.3.3 ✓ purrr 0.3.4
## ✓ tibble 3.1.2 ✓ dplyr 1.0.6
## ✓ tidyr 1.1.3 ✓ stringr 1.4.0
## ✓ readr 1.4.0 ✓ forcats 0.5.1
## ─ Conflicts ───────────────────── tidyverse_conflicts() ─
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(gridExtra)
##
## 次のパッケージを付け加えます: 'gridExtra'
## 以下のオブジェクトは 'package:dplyr' からマスクされています:
##
## combine
old = theme_set(theme_gray(base_family = "HiraKakuProN-W3"))
g1 <- ggplot(data=data.frame(X=c(-4,4)), aes(x=X)) +
xlab("")+ylab("") +
stat_function(fun = dnorm, args=list(mean=0,sd=1)) +
geom_vline(xintercept = 0)
DF <- 10
g2 <- ggplot(data=data.frame(X=c(0,40)), aes(x=X)) +
xlab("")+ylab("") +
stat_function(fun = dchisq,args=list(df=DF)) +
# 平均値
geom_vline(xintercept=DF) +
# 最頻値
geom_vline(xintercept=DF-2) +
# 中央値
geom_vline(xintercept=DF-(2/3)+(4/(27*DF))-(8/(729*DF^2)))
grid.arrange(g1, g2, ncol = 1)