統計分布
分布に関連する関数の名付け方
ddistname( x, 引数) |
xにおけるdistname分布の確率(密度)関数の値 |
pdistname( x, 引数) |
xのdistname分布の下側確率 ( 分布関数 F(x) の値) |
qdistname( p, 引数) |
distname分布の F(x)=p となる確率点 x |
rdistname( n, 引数) |
n個のdistname分布の乱数値ベクトル |
下の表の個別分布名と組み合わせて使用する。
例) runif(25,-1,1) #[-1,1]一様乱数を25個生成し、ベクトルとする。
例) rnorm(25,10,2) #平均10,標準偏差2の正規乱数を25個生成し、ベクトルとする。
例) dnorm(0:3) #標準正規分布密度関数f(x)のx=0,1,2,3における値のベクトル。
例) pbinom(3,5,0.3) #確率prob=0.3、大きさsize=5の二項分布で、3以下の値の出る確率
個別分布
distname | 分布名 | 引数 | オプション | デフォルト |
beta | ベータ分布 | shape1,shape2 | | |
binom | 二項分布 | size , prob | | |
cauchy | コーシー分布 | | location , scale | 0 , 1 |
chisq | カイ二乗分布 | df | | |
exp | 指数分布 | - | rate | 1 |
f | F分布 | df1 , df2 | | |
gamma | ガンマ分布 | shape | | |
geom | 幾何分布 | prob | | |
hyper | 超幾何分布 | m , n , k | | |
lnorm | 対数正規分布 | | meanlog , sdlog | 0 , 1 |
logis | ロジスティック分布 | | location , scale | 0 , 1 |
nbinom | 負の二項分布 | size , prob | | |
norm | 正規分布 | | mean , sd | 0 , 1 |
rmvnorm | 多次元正規分布 | | mean=rep(0,d), cov=diag(d), sd, rho | |
pois | ポアソン分布 | lambda | | |
stab | 安定分布 | index | skewness | 0 |
t | t分布 | df | | |
unif | 一様分布 | | min , max | 0 , 1 |
weibull | ワイブル分布 | shape | | |
mvnorm | 多次元 正規分布 | mean, cov, sd, rho, d | | |
wilcox | ウィルコクソン 順位和統計量 | m , n | | |
注:多項乱数は次のような方法で生成できる。
例:A,B,C,D を等確率で取る乱数10個:
sample(x=letters[1:4], size=10, replace=T, prob=(1:4)/10)
乱数に関する関数
set.seed(i) |
乱数の種 (.Random.seed) を 整数 i ( 0 から 1023)にセットする。 |
分布に関する比較/検定
cdf.compare(x, y = NULL, distribution = "分布名", ...) |
経験分布関数を描画する。
|
ks.gof | Kolmogorov-Smirnov適合度検定 |
例:cdf.compare(rnorm(100,1,2),dist="normal",mean=0,sd=2)
# N(1,2^2)正規乱数 100 サンプルの経験分布関数をN(0,2^2)正規分布の分布関数と比較する
例:cdf.compare(rnorm(100,1,2),rnorm(100,0,2))
# N(1,2^2)正規乱数 とN(0,2^2)正規乱数 100 サンプルの経験分布関数を比較する
指定できる分布名: "normal", "beta", "cauchy",
"chisquare", "exponential", "f", "gamma", "lognormal",
"logistic", "t", "uniform", "weibull", "binomial",
"geometric", "hypergeometric", "negbinomial", "poisson",
"wilcoxon"