2012年4月25日水曜日

平均、標準偏差、平均の信頼区間


○あるデータの値が平均と"たいして"変わりがないかどうか知りたい。
この疑問がある場合、あるデータの値が上述の信頼区間に入らない場合は、そのデータの値は統計的には平均と異なると見なします。ここで、もし、95%の信頼区間を採用する場合で、もし手元のデータがこの範囲に入らない場合は、5%以下の危険率で平均と異なる、もしくは、平均との差が有意であるという言い方をします。また、もし、手元のデータが信頼区間内に入るならば、母集団の平均も指定した確率でその信頼区間のどこかにあるわけですから、そのデータは平均と"たいして"変わらないと考えてもよいのではないでしょうか。 

なお、信頼区間を計算する場合、%の値を指定しなければなりませんが、この%の値次第ではあるデータの値が統計的に平均値と異なったり、その逆になったりします。したがって、信頼区間の%の値はできるだけ客観的に決めるのが一般的です。逆に、信頼区間を%の値を変えて何例か計算し、目的にあう信頼区間の%の値を決める場合もときにはあるようです。この信頼区間は%の値が大きくなるにつれ、広くなり、100%では無限大となります(従って、100%の信頼区間は無意味です)。


どのような生態系は、人間の影響を受けている

○あるグループの平均値と別のグループの平均値との差が"重要"かどうか知りたい。
この疑問がある場合、片方のグループ(甲)の平均の信頼区間を求め、その範囲の中にもう一つのグループ(乙)の平均が入るかどうかを上のようにして判断する方法がありますが、この方法ではグループ甲のデータの散らばり具合は考慮されますが、グループ乙のデータの散らばり具合は無視されてしまいます。これに対し、異なった平均及び標準偏差を持つ2つのデータ群の平均の差については、その統計的性格がわかっていますので、それを利用して判断する方法があります。なお、いずれの方法についても、上と同様に、信頼区間の%を指定する必要があり、その値次第で結論が変わってしまいます。


リチウムの物理的性質は何ですか

○あるデータがどのグループに属しているのか知りたい。
この問題は、このページの例では、手元にデータがあり、それがデータ群A又はBのどちらに属する可能性が高いのかを知りたい場合です。基本的な考え方は、手元のデータの値と両グループの平均値迄の"距離"を調べ、より近い側に属すると判断するということなのですが、この"距離"を計算する際には2つの値の単純な差ではなく、それにデータ群A及びBのデータの散らばり具合、すなわち標準偏差の影響を加味する点がみそとなります。上の2母集団の場合、どちらに属するかの境界は約106.67になり、2母集団の平均の中央の110.00よりもA側になります。これは母集団Aのデータの散らばり具合が母集団Bのデータの散らばり具合より小さいので、本来母集団A に属するデータは母集団Bのデータに比べ、自分の属する母集団の平均により近く分布する可能性が高いためです。なお、このような方法は、複数の特性をもつデータに対しても適用できます。具体的には、たとえば農産物であれば、各試料の重量、長さ、幅、水分含有量、特定の栄養素含有量といったような、異なった特性を総合的に取り入れて計算し、グループ分けの判断の参考にすることもできます。


遺伝子型は何ですか

○母集団の数が少なく、その平均が簡単に計算できる場合の信頼区間の意味は?
たとえば、ある学校のクラスのあるテストの平均の場合を考えてみます。この場合、生徒数はたかだか数十人ですから、その得点の平均や標準偏差を計算し、度数分布図をつくるのはたいした手間ではないでしょう。もし、このテスト結果を母集団と考えれば、これで母集団の平均が計算でき、データの散らばり具合もわかったわけですから推定するべきものはもはや何もないことになります。しかし、もし、手元のテスト結果を、同じレベルのテストを同じレベルの生徒多数に行った場合の1サンプル群と考えたらどうでしょうか?そのように考えられる場合は、平均値の信頼区間を計算することにより、より正確にこのテストの平均が� �握できることになります。

また、工場で製造工程の条件を変えて、製品にどのような影響がでるかを調べる場合を考えてみましょう。この場合、試験的に製造する製品の数は普通は限られていて、そのような試作品すべての平均を計算することは容易でしょう。ですが、これは本来もっと多数製造されるべき製品の1サンプル群と考えるべきではないでしょうか?その場合は、上と同様に、平均の信頼区間を計算することにより、より正確に製造工程の条件の変更の影響が見積もれることになります。


○データが比率の場合は?
このページでは平均の値についての話が中心でしたが、値ではなく、賛成と反対、白と黒、正と負のように比率が問題になる場合もあるでしょう。比率の信頼区間等については今までに記述してきた平均の信頼区間等の計算とはやや数式が変わりますが、計算可能で、同じような考え方が適用できます。

○母集団の平均がわからないのにその標準偏差がわかっていることはあまりないのでは?
これは実にもっともな疑問です。このページで取り上げたように、母集団が正規分布している場合は、実はサンプルのデータの標準偏差から母集団の標準偏差及びその信頼区間が計算できます。したがって母集団の平均ではなく、そのデータの散らばり具合を知りたい場合も上で記述した平均値の推定と同様にサンプルから推定できます。なお、サンプルデータの平均の信頼区間は母集団の標準偏差がわかっていない場合でも、計算できます。

当事業所に関するお問い合わせ、お見積もりはこちらへ。



These are our most popular posts:

95%信頼区間

2003年6月19日 ... 同様にして,50%信頼区間ならば両側の25%ずつを切り捨てて -0.67 ≤ x ≤ 0.67,90 %信頼区間なら両側の5%ずつを切り捨てて-1.65 ≤ x ... この方法をとると,有限母 集団に対しても無限母集団の仮定がかなり通用するようになる。 read more

信頼区間 - Wikipedia

信頼区間」と表現する。値 x (または (100 \cdot x) \% )は、信頼水準または信頼係数と 呼ばれ、95%あるいは99%などの数値を用いる。 信頼区間は普通、標本から計算され た統計量とともに与えられる。 例えば「信頼水準95%で、投票者の35%から45%がA ... read more

4.2 平均差の信頼区間

信頼区間を求めるには次のようにするのでした。 ... 不偏分散は、分散の計算式の中で「 個数」で割るところを「個数-1」で割ったものでした。 ... これは不偏分散を求める方法と 同じで、平均からの偏差の平方和を(標本数-1)で割ったものに相当します。 read more

2項分布 母比率の信頼区間の求め方

1 力による計算 2 F分布、ベータ分布関数使用による計算 (1)F分布を使用する方法 (2) ベータ分布を使用する方法 《引用文献》 母比率の信頼区間を求める方法としてF分布を 使用するものがある。ところがその根拠をきちんと書いてあるものがなかなか見つから ... read more

0 件のコメント:

コメントを投稿