2ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

統計学なんでもスレッド6

1 :132人目の素数さん:2007/01/27(土) 03:31:38
前スレ
統計学なんでもスレッド5
http://science5.2ch.net/test/read.cgi/math/1145362721/
統計学なんでもスレッド4
http://science4.2ch.net/test/read.cgi/math/1123896809/
統計学なんでもスレッド3
http://science3.2ch.net/test/read.cgi/math/1097491056/
統計学なんでもスレッド2
http://science3.2ch.net/test/read.cgi/math/1068288283/
統計学なんでもスレッド
http://science.2ch.net/test/read.cgi/math/1012782106/

関連スレ
= 統計解析フリーソフト R =
http://science3.2ch.net/test/read.cgi/math/1062650510/

2 :にょにょ ◆yxpks8XH5Y :2007/01/27(土) 09:23:35

今だ!2ゲットォォォォ!!
 ̄ ̄∨ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
     ∩ ∩
   〜| ∪ |         (´´
   ヘノ  ノ       (´⌒(´
  ((つ ノ⊃≡≡≡(´⌒;;;≡≡≡
   ̄ ̄ ̄(´⌒(´⌒;;
   ズズズズズ

3 : ◆TuTO3UJe2Y :2007/01/27(土) 14:15:57
新スレでは答えます

4 :132人目の素数さん:2007/01/27(土) 16:28:28
くんまー拡大!

5 :132人目の素数さん:2007/01/27(土) 21:03:43
レポートで回帰分析の結果書くんだけど回帰分析にも帰無仮説ってあるの?
あれば書いた方がいいですか?

6 : ◆TuTO3UJe2Y :2007/01/27(土) 21:53:16
>>5
場合による
あれば勿論書いた方がいいっていうか書かなきゃダメ

7 :132人目の素数さん:2007/01/28(日) 05:47:59
【統計を】理系に多い血液型は何??【取ろう】
http://science5.2ch.net/test/read.cgi/rikei/1094367065/
◆統計学について語るスレ
http://science5.2ch.net/test/read.cgi/sim/1012828891/
【製薬企業】 ☆統計解析スレッド其の壱☆ 【CRO】
http://school6.2ch.net/test/read.cgi/doctor/1039331241/
= 統計解析フリーソフト R 【第2章】 =
http://science5.2ch.net/test/read.cgi/math/1152449095/
【●】 文部科学省 統計数理研究所 part2
http://science5.2ch.net/test/read.cgi/math/1054036747/
統計ソフト統合スレッド−SPSS・SAS以外
http://academy5.2ch.net/test/read.cgi/psycho/1012801769/
心理統計スレッド3
http://academy5.2ch.net/test/read.cgi/psycho/1160242677/
統計学
http://academy5.2ch.net/test/read.cgi/sociology/982489314/


8 :132人目の素数さん:2007/01/28(日) 05:49:05
えらそうな住人〜経済学的統計と解析〜社会学板
http://academy5.2ch.net/test/read.cgi/sociology/1136371390/
なんで統計学者って経済学部出身者が多いの?
http://academy5.2ch.net/test/read.cgi/economics/1139223663/
統計・計量分析で一番使われてるソフトは?
http://academy5.2ch.net/test/read.cgi/economics/1106197885/
経済学で使う統計学スレッド
http://academy5.2ch.net/test/read.cgi/economics/1094012265/
統計・解析ソフトについて
http://pc10.2ch.net/test/read.cgi/bsoft/1012298063/
Data Mining (データマイニング) part 1
http://science5.2ch.net/test/read.cgi/sim/1101296843/
【金鉱脈】データマイニングのスレ【発見】
http://pc10.2ch.net/test/read.cgi/linux/1139645444/
☆統計学が出来ないマーケティング学者☆
http://money5.2ch.net/test/read.cgi/manage/1104337367/


9 :132人目の素数さん:2007/01/29(月) 22:57:45
VARモデルについて、わかりやすく解説してある本などご存知でしたら教えていただけないですか?

10 :132人目の素数さん:2007/02/01(木) 11:17:47
レポートの提出期限が過ぎたからか、静かだな…

11 :132人目の素数さん:2007/02/02(金) 13:57:37
よく文章にでてくる

~ ind

の ind ってどんな意味?

Y(i) ~ ind Poisson(mu(i))みたいな


12 :132人目の素数さん:2007/02/02(金) 15:25:03
independently

independently
identically
distributed

i.i.d.
と略して使うよ。

13 :132人目の素数さん:2007/02/02(金) 15:56:54
independently了解です。助かります。
independent か induction かなーとか勝手におもってました。


14 :132人目の素数さん:2007/02/03(土) 02:29:42
多変量T分布の分散と、
ウィシャート分布(多変量カイ2乗分布)の平均の求め方が載っている参考書か、
サイトしりませんか?
全くできません・・・

15 :132人目の素数さん:2007/02/03(土) 03:19:54
統計学が科目としてある資格を教えてちょんまげ

16 :132人目の素数さん:2007/02/03(土) 10:43:57
アクチュアリーとか統計士とか臭気判定士とかぐらいしか思いつかん。
公認会計士など選択に入っているのはまだまだあるやろな。

17 :132人目の素数さん:2007/02/04(日) 01:11:29
離散型でも連続型でも、どんな分布だろうと、
確率分布関数は存在するけど
確率密度関数はあるとは限らない

これは正しいですか?

18 :132人目の素数さん:2007/02/04(日) 01:31:45
正しいです。

19 :132人目の素数さん:2007/02/04(日) 02:20:21
F分布で、F(m,n,α)=1/F(n,m,α)と本には書いてあるのに、F(m,n,α)=1/F(m,n,α)として例題は解いてます
どちらが正しいんですか?

20 :132人目の素数さん:2007/02/04(日) 06:25:25
>>19
正しいのはF(m,n,α) = 1/F(n,m,1-α)
密度関数を適当に変数変換すれば簡単に証明できるよ


21 :19:2007/02/05(月) 03:16:17
>>20
THANX


22 :132人目の素数さん:2007/02/07(水) 15:28:51
最小二乗法の重みづけの計算方法がどうしてもわかりません
ttp://homepage3.nifty.com/m_nw/dataac3j.htm
上のサイトに詳しく説明が書かれているのですが、計算部分がどうしてもうまくいきません。
ソフトを使った結果と全く違う結果になってしまいます。
問題は単純に(x,y)のデータ群があってこれに対応するy=ax+bの係数を導きたいです。





23 :132人目の素数さん:2007/02/07(水) 21:58:27
丁寧ねえ……。思うとだろうとかはずとかが目立つページですな。

> 全体を通じて乱文となってしまいましたので、不明の点、不適切な表現等
> ございましたら 掲示版又はメールにてお知らせください。

って書いてあるんだから著者に尋ねたら?

24 :132人目の素数さん:2007/02/08(木) 11:37:28
>>22
そのサイトの公式間違ってない?
記号の定義を俺が勘違いしたのかもしれないけど
書いてある通りに計算するとxの3次の項が出てくるんだが…

回帰式を y_{i} = ax_{i}+bとして、二乗誤差
f = \sum_{i=1}^{n} (y_{i} - ax_{i}-b)^{2}
の最小化を考える

これをa,bで偏微分して0とおくと
df/da = \sum_{i=1}^{n} -x_{i} * 2(y_{i} - ax_{i}-b) = 0
df/db = \sum_{i=1}^{n} -2(y_{i} - ax_{i}-b) = 0
となるから、これをa,bについて解く

すると
a = S_{xy} / S_{x}
b = \bar{y} - a\bar{x}
となる。
ただし、\bar{x},\bar{y}はそれぞれx,yの平均
S_{x}はxの分散、S_{xy}はxとyの共分散である。

こんな感じか?TeX使えないと数式書くの面倒だな


25 :132人目の素数さん:2007/02/08(木) 18:40:49
はじめまして。生物板から来ました。

あっちの板でちょっとお祭りになっています。
前スレhttp://science5.2ch.net/test/read.cgi/life/1094584332/179-
今スレhttp://science5.2ch.net/test/read.cgi/life/1170907261/

最近世間をにぎわした灯台工学研究科の捏造事件がありましたが、実は2ちゃんではあの事件と同じぐらいの有名な捏造疑惑が知られていました。
この捏造王子が当時いつお縄になるかとみなワクテカしてたけど、長く海外逃亡していて忘れちゃってました。
ところが最近この捏造王子がテニュアトラック教員として帰国することになり、お祭りになったという次第です。
現在、この捏造王子の過去の仕事のあやしさを住人たちが検証している最中といったところです。

そこでそのあやしいデータのひとつとして以下のページにでてくるグラフが話題になっています。
ttp://www.brain.riken.go.jp/bsi-news/bsinews20/no20/research2.html
培養した細胞に3種類のタンパク質を組み合わせを作って導入しその効果を見たというものです。
ところがこのグラフが我々ナマモノ屋から見てきれい過ぎるのです。
特に5%程度の差が矛盾なく観察されるためには膨大な観察数が必要だと考えます。
ただ生データが示されておらず、簡単な検証方法を思いつきません。
そこでこのスレの専門家の方にひとつご助力を賜りに参りました。
どうかよろしくお願い申し上げます。mOm

参考レスhttp://science5.2ch.net/test/read.cgi/life/1170907261/50

長文陳謝 orz

26 :132人目の素数さん:2007/02/08(木) 21:00:08
この↑問題、なにとぞ統計スレの先生方のお力をお貸しくださいOrz
このままでは日本は捏造大国になってしまいます。

27 :132人目の素数さん:2007/02/08(木) 22:44:25
ローリング相関ってなんですか?

28 :132人目の素数さん:2007/02/08(木) 23:06:07
データの捏造方法
1 べつのサンプルのデータにするかえる
2 自分で数字をいじる
3 統計資料から拝借してラベルを付け替える


29 :132人目の素数さん:2007/02/08(木) 23:23:29
>>28
すいませんがよくわからないのでもう少し具体的に説明していただけませんか?

30 :132人目の素数さん:2007/02/08(木) 23:27:42
>>29
いや>>28さんは質問してるんじゃない?
捏造王子は間違いなく2をやってます。
何とか検証する方法は無いでしょうか?

31 :132人目の素数さん:2007/02/08(木) 23:45:19
出現する数字の分布が正規分布でない

32 :132人目の素数さん:2007/02/08(木) 23:52:12
データの中に自分のサインを残している

33 :132人目の素数さん:2007/02/09(金) 00:00:47
>>25
データ数が分からないことには何とでも言えそう。
回帰分析でそれぞれの効果を推定するときれいに出るが、
それを仮に真値としたとき偶然このデータが得られる確率は
データ数に依存します。最も無理のない結果のための
データ数は各群350ぐらいと出ました。
(そのときの確率は0.11ぐらい。当てはまり過ぎと言われない確率0.05を
超えるのは大体データ数150以上が必要です。)
細胞のデータと言うことですからこのぐらいの数は取っているのでは?


34 :132人目の素数さん:2007/02/09(金) 00:20:21
>>33
ありがとうございます。
データ数を何に相当すると考えるかで少し違いますが、通常は培養皿ごとに計数して、
複数の培養皿からの数値で平均を取って検定します。
つまりデータ数は培養皿数に相当すると考えられます。
そして150も350もほぼ不可能な培養皿の数(通常は多くて10)です!!

35 :132人目の素数さん:2007/02/09(金) 00:51:57
統計量Sn、Tnは漸近的に同値であり、また、Snは分布関数Fに分布収束するとする。
このときTnもFに分布収束する。

という命題を証明したいのですが、糸口がつかめません。
どなたかヒントだけでもいいので教えていただけませんでしょうか?

36 :132人目の素数さん:2007/02/09(金) 00:53:44
>>28,>>31-33
皆様さきほどは急いでいて御礼が不充分で申し訳ありませんでした。本当に感謝しております。m0m
現在、頂いた回答を向こうのスレに貼って、向こうで実験系に詳しい人たちとの議論待ちです。
その結果また何か分からないことや私の事実誤認があったらお手数をおかけして恐縮ですが
再度ご相談に参ります。よろしくお願いいたします。

37 :132人目の素数さん:2007/02/09(金) 01:17:27
>>34
また見に来るだろうから書いておくが、そんなに少ないならこんな感じ。
各群10個:p=0.00005530468
各群20個:p=0.0004044062
各群30個:p=0.001247549
各群40個:p=0.002702961
各群50個:p=0.004825427
もちろん推定された効果通りにきれいな真値であるわけではない可能性も
あるので上記のp値の計算は額面通りには受け取れません。
ただし、交互作用まで分散分析をかけると各効果はp=0.05ぐらいで
効いているのに対して交互作用はどれもp=0.2ぐらいできれいに
効いていないと出るので線形性は抜群なのですけどね。

38 :132人目の素数さん:2007/02/09(金) 01:21:58
>>37
自己レス。
培養皿の効果が0, 1ならその通りなのだが、
それをある程度の細かさで分類しているならデータ数は培養皿数とは
言えないだろう。皿が10個としてその程度が1/15区切りでつけられるのなら
ぎりぎりOKとなるかな。

39 :132人目の素数さん:2007/02/09(金) 05:44:51
>>35

xをTnの連続点とすし、εを任意の整数とする。
Pr{Tn<=x}=Pr{Tn<=x, |Sn-Tn|<ε}+Pr{Tn<=x, |Sn-Tn|>=ε}


40 :35:2007/02/09(金) 08:37:20
>>39
ありがとうございます。
それを参考にして考えてみます。

41 :132人目の素数さん:2007/02/09(金) 21:15:02
>>33,37
自己レス。
計算を間違ってた。_| ̄|○
n=350のときのp値は0.385だった。0.5までいくにはn=400ぐらい必要。
0.05を超えるのはn=150過ぎだが、小さいときの表は次のように修正。
各群10個:p=0.000002530724
各群20個:p=0.00003769463
各群30個:p=0.0001776871
各群40個:p=0.000523022
各群50個:p=0.001189512
結局一つの皿でどのぐらいの精度の結果を得ているか次第です。
10個だとやはり5%刻みぐらいのデータが得られていないと
だめでしょう。

42 :132人目の素数さん:2007/02/09(金) 21:36:35
SPSSやJMPを使った集統計が三度の飯の次くらいに好きなんだが、
こんなオイラを雇ってくれる奇特な研究室はないかな。

43 :132人目の素数さん:2007/02/09(金) 22:03:29
>>42
おしい!三度のメシより、だったら家で雇ったのに。
あとRな。

44 :132人目の素数さん:2007/02/10(土) 22:31:00
集統計屋さん、うちの研究室にはいるよ@年収600マン・ポスドク・野心なしの主婦。
さくさくやってくれるんで、ボス以下全員すごく助かってる。
売り込んでみたら?

45 :132人目の素数さん:2007/02/10(土) 23:22:31
>>41
統計スレの神

本当にありがとうございます。みな深く感謝しています。

ちょっと若干1名場外乱闘で粘着があり、とばっちりで不快な思いをさ
せたかも知れず申し訳ありません。

向こうはダミーで、こちらに書き込みさせてください。

ご指摘の件はもういちど良く考えて見ます。捏造王子たちが適当に
直線を引いた可能性が高くなってきたと思っています。

もひとつ質問なのですが、捏造王子たちはこのグラフの隣り合う区画
同士の平均値の差が統計的に有為である、としているようです。これ
はt検定ですが、この隣り合う二群間での平均値の差の検定に必要な
サンプル数を彼らは満たせているでしょうか?

誤解があったら申し訳ありません。

よろしくお願いします。

46 :132人目の素数さん:2007/02/10(土) 23:23:55
葛西そこそこでヴィドはヴィドったwww

47 :46:2007/02/10(土) 23:24:42
すいません、誤爆しました

48 :132人目の素数さん:2007/02/11(日) 00:34:07
>>45
せっかく作ったのでこちらに載せときます。
乱数で見るデータの例です。
1500個を150個ずつ群にまとめた場合
0.427 0.387 0.367 0.433 0.420 0.380 0.380 0.393 0.360 0.313
300個を30個ずつ群にまとめた場合
0.633 0.500 0.333 0.367 0.567 0.467 0.467 0.300 0.333 0.367
もしデータが入手できて各群300個ぐらいしかないのに挙動が1500個のときと
同じ程度なら(そうでないと棄却はできないはず)
二項分布の方に疑いが行きます。

49 :132人目の素数さん:2007/02/11(日) 05:46:32
国立医学部一年の般教で統計やってます
圧倒的に意味が不明
母比率とか意味不明
なんで偏差平方和をnで割ったら分散じゃないの?

50 :132人目の素数さん:2007/02/11(日) 11:00:42
それじゃ一昔前の高卒にも劣るよ

51 :132人目の素数さん:2007/02/11(日) 12:52:52
>>50
だって授業なんて聞いてないし笑
説明ヨロ☆

52 :132人目の素数さん:2007/02/11(日) 13:35:14
>>51
聞いてなくても本読めばわかるだろ笑

53 :132人目の素数さん:2007/02/11(日) 14:02:02
>>52
大学の過去問しかない…笑


54 :132人目の素数さん:2007/02/11(日) 14:24:29
>>49
授業で使ってる教科書に書いてあるんじゃね?

宿題の答え聞かれてる気がするからあまり詳しく答えたくないけど…
nでなくn-1で割るのは推定値の不偏性(推定値の平均が真の値になるという性質)を満たすため
偏差平方和の平均値出してみな


55 :132人目の素数さん:2007/02/11(日) 14:39:25
http://phi.ypu.jp/oldlec/social_stat_p05.html

56 :132人目の素数さん:2007/02/11(日) 15:12:14
>>54
ありがとう!
教科書はないんだ。
授業中にもらうしょぼいプリントだけ。当然どっかいった笑
宿題じゃなくて後期試験の科目なんだよね
友達からプリント借りて調べてみよう。
統計を勉強する上でコツみたいなの教えてください笑

57 :132人目の素数さん:2007/02/11(日) 20:19:44
平均と期待値の違いってなんですか?

58 :132人目の素数さん:2007/02/11(日) 23:03:43
完備十分統計量は最小十分統計量であるということを証明したいんですが、なかなか証明ができません。
証明の道筋をどなたか教えてください。

59 :質問です。:2007/02/15(木) 19:57:02

>控除率の実際
>以下に主なカジノゲーム、公営ギャンブルなどにおける控除率を挙げる。プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
>ミスのない完全なプレーを行うことを前提とする。

>スロットマシン 3%〜15%
>様々。ここでは一般的と思われる値を挙げた。

http://ja.wikipedia.org/wiki/%E6%8E%A7%E9%99%A4%E7%8E%87)より転載。

ということは、スロットマシンの腕がどんなに良い人でも、控除率を3%〜15%より下げるのは無理だということですか?
また、ヘタクソな人がやれば、控除率は3%〜15%よりかなり上がるということでしょうか?

あと基本的な質問ですが、控除率が2%のギャンブルというのは、簡単に言えば
100円を元手に無限回挑戦し続けると、元手が98円に減るということですか?

60 :132人目の素数さん:2007/02/16(金) 00:30:33
>>59
控除率が正のものを無限回やったら破産しますがな。w

61 :132人目の素数さん:2007/02/16(金) 00:34:01
人が無限回できることって無限小の距離を移動することとかですか

62 :質問です。:2007/02/16(金) 20:45:00
>>60
どうも根本的なところを勘違いしていたようですね。

ではこういうことでしょうか?

控除率が2%のギャンブルを一回やると、当然、元手が増える人も減る人もいるが、
参加した全員の平均をとってみると、元手の98%に減ったという結果になるということですか?

また、控除率が2%のギャンブルというのは、参加した全員の掛けた金の合計の2%が確実に親のポッポに入るということでいいの
でしょうか?

また変な勘違いをしていたら教えてください。


63 :132人目の素数さん:2007/02/16(金) 21:18:32
>>62
手数料という表現からすると概ねそれでよいのでしょう。
ただし、なんらかの必要経費が生じるものだとそれがそのまま利益という
訳ではないのでしょうが。

64 :132人目の素数さん:2007/02/16(金) 21:31:29
文鳥が好きで煙草を吸わない30代独身男性は、
日本国内に何人くらいいると考えられますか?

65 :質問です。:2007/02/18(日) 11:55:27
>>63
レスありがとうございます。
だいたい分かりかけてきました。最後の質問にしたいと思いますが、

>控除率の実際
>以下に主なカジノゲーム、公営ギャンブルなどにおける控除率を挙げる。プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
>ミスのない完全なプレーを行うことを前提とする。

>スロットマシン 3%〜15%
>様々。ここでは一般的と思われる値を挙げた。

http://ja.wikipedia.org/wiki/%E6%8E%A7%E9%99%A4%E7%8E%87)より転載。

”プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
ミスのない完全なプレーを行うことを前提とする。 ”


と、いうことは、スロットの腕がどんなに良い人でも控除率を3%以下に下げるのは不可能であり、
素人がやると、もちろん控除率は腕の良い人より上がるということでしょうか?


66 :132人目の素数さん:2007/02/18(日) 21:17:26
>>65
まだ勘違いしてますよ。
控除率はどのプレーヤーに対しても一律で貸せられる場所代や税金のようなものです。
どんなに上手にプレーをしても、控除率は変わりません。
ただ、上手にプレーすれば、下手くそにプレーするよりも、最終的に手元に残る金額は多くなりますが。しかしこれは控除率とは何ら関係のないものです。

67 :132人目の素数さん:2007/02/20(火) 16:08:47
統計学って

ある確率が1%以下であるなら、それは絶対におかしいと決めるような学問なの?

68 :132人目の素数さん:2007/02/20(火) 16:54:05
ベータ分布のパーセント点を求める近似式をcで作らなきゃいかんのだが
どうやるんだ?

69 :132人目の素数さん:2007/02/20(火) 21:01:57
>>68 数値計算のアルゴリズム本(e.g. 奥村さんのアルゴリズム事典 http://oku.edu.mie-u.ac.jp/~okumura/algo/)を探すか、 フリーの有り物(e.g. dcdflib.c)を使う。

70 :132人目の素数さん:2007/02/20(火) 22:24:04
分らない問題スレで核心にせまるレスが付かなかったため、
統計スレの皆様、お力添えくださいm(_ _)m

■問題
A君とB君は互いに相手よりもテニスが強いと言い張ります。
そこで、10試合をして勝敗によりどちらのほうが強いか決めようということになりました。
統計学的に有意に強いと認められるには、どちらかが何勝すれば良いでしょうか。
ただし、引き分けは無いものとする。

■自分で考えた答え(合っていますか?)
A君とB君の勝敗の組み合わせ数は2^10=1024通り
10試合のうちA君が8勝する組み合わせ数は10!/(8!2!)=45通り
10試合のうちA君が9勝する組み合わせ数は10!/(9!1!)=10通り
10試合のうちA君が10勝する組み合わせ数は10!/(10!0!)=1通り

従ってA君とB君が互角と仮定すると
A君が8勝以上する確率は(45+10+1)/1024≒0.055
A君が9勝以上する確率は(10+1)/1024≒0.011

統計学的に有意に強いと認められるには、互角となりうる危険率を5%以下にする必要があるから 9勝以上しないといけない。

この解答は合っていますか?

71 :132人目の素数さん:2007/02/20(火) 22:36:56
>>69
ありがとう。やっぱり不完全ベータ関数を計算してニュートンで求めるしかないのかな?

72 :132人目の素数さん:2007/02/20(火) 23:08:18
>>71
Handbook of Mathematical functions には近似式載ってる。
けど、精度書いてない。

dcdflib.c の cdfbet() は、逆分布関数も計算できる。


73 :132人目の素数さん:2007/02/20(火) 23:38:15
統計超・超初心者のとっちょです。

ある生産工程の不良率(良品率)を調査するために製品を10個抜き取り、寸法を
測定しました。結果は以下の通りです(単位:mm)。

2,2,2,2,2,3,3,3,4,5 平均:2.8 標準偏差:1.0

製品規格は下限規格のみで1mm以上です。上限規格はありません。
分布の形状は右側(値の大きい)に裾野の広い分布であり、工程の設備能力からも
合点のいくところで、偏ったサンプリングをしているとは考えにくいです。

こんな分布をしている場合の工程不良率を算出しようとした場合、どのように算出
したら良いのでしょうか?当HPのポアソン分布等を拝見したのですが、初心者の私
には、ポアソン分布を使って良いものか否か分からない状況です。

こんな私にご教授頂ければ幸いです。よろしくお願いします。

74 :132人目の素数さん:2007/02/20(火) 23:50:26
>>72
サンクス。これはつかえそう!

75 :132人目の素数さん:2007/02/22(木) 20:59:46
>>73
ポアソン分布はサッカーの得点みたく離散型データの場合。
その場合は、測定精度が粗くて値の種類が少ないから、
データの相対度数分布をそのまま確率分布(の推定値)として使うのが吉。
つまり理論分布なんぞイラネ。

76 :132人目の素数さん:2007/02/22(木) 21:38:27
いきなりすいません。必死で探してるんですが正確度の計算方法が
わかりません。
今まで人の目で数えていたものを機械で数えようとしています。
人の目で数えたものと機械で数えた数字の正確さを表す数値として
正確度というのがあるのことまではこぎつけたのですが、その計算式が
わかりません。
どなたか教えていただけませんか?

77 :132人目の素数さん:2007/02/23(金) 05:01:21
すいません。統計学初学者です。
正規分布の加法性でわからないことがございます。

1.N(u1, σ1^2) + N(u2, σ2^2) → N(u1 + u2, σ1^2+σ2^2)
2.N(u1, σ1^2) - N(u2, σ2^2) → N(u1 - u2, σ1^2+σ2^2)

正規分布を足しても引いても、
平均はそれぞれ、足されるあるいは引かれますが、
なぜ、分散だけはどちらも足されるのでしょうか?
分散は引くことは出来ないものなのでしょうか?

よろしくお願いいたします。


78 :132人目の素数さん:2007/02/23(金) 11:42:23
>>76
統計学全体で通じる「正確度」なんてありません。応用している各分野で
系統誤差を使いやすいように数値化しています。例えば、測定値の平均を
から実際の値を引いたものなどを使います。

関係している工学の人に「正確度」「精密度」についてきいてください。


79 :132人目の素数さん:2007/02/23(金) 11:59:52
>>77
式のイメージではなく、分散とはどういう数かをまず考えてみてください。
2つの正規分布は無相関なので、定義にしたがって分散を計算すると和に
なります。

2つの確率変数の間に相関があれば、分散は和にはなりません。例えば、
極端な場合で u2 = - u1 という関係があるとすると、分散は 0 になっ
てしまいます。この場合でも、分散を引いている訳ではありません。
教科書で「共分散」というのを調べてみてください。


26 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.02.02 2014/06/23 Mango Mangüé ★
FOX ★ DSO(Dynamic Shared Object)