釣り統計学入門
おまえは何時も小物ばかり釣って喜んでいる
あいつは何時もオレより大きな魚を釣る
とかく釣り人は自分の釣果を自慢したり、人の釣果を羨んだりしがちです。
でも釣果の差って何なんでしょうね?
釣れた魚のサイズ?釣れた魚の数?
漠然とした基準で大物が釣れたとか沢山釣れたとか言ってますよね。
同じ釣果でも立場によってオレの方が上だとかいやいやたいしてかわらんとか、評価が分かれてしまうのが釣り人界の常でしょう。
これを個人的な感情や感覚でなく客観的に評価できるようにしようというのが今回の話題です。
釣果に限らず、世の中で起こっている事象を言葉だけで表現すると、どうしても個人の気持ちや評価が入り込み、客観的な評価とはなり難いものです。
しかしここで数字を用いることで客観的な評価ができるようになります。
空間と形を客観的に表す言語として幾何学があったように変化や違いを客観的に表す言語として統計学があるのです。
まずは釣った魚のサイズを比較してみましょう。
とりあえず被験者はこれを読んでいるあなたとこれを書いている私と言うことにしましょう。
条件設定1
@ 二人は一緒に同じポイントで釣りをしました。
A 二人とも1尾づつ釣りました。
このケースでは、二人の釣った魚のサイズの比較は1:1なので非常に簡単です。
では二人がそれぞれ15尾と20尾のアマゴを釣ったとしましょう。
でも全部持って帰っても仕方ないのでランダムにリリースとキープを繰り返し、最終的に私の魚篭に8尾、あなたの魚篭に10尾のアマゴが入っていたとしましょう。
さて、この二人の釣果、何をどうやって比較すればどちらの釣果が大物だったといえるでしょうか?
最大サイズの比較というのも一つの手でしょう。
平均サイズの比較という手もあります。
一般的に釣り大会では大物を比較しますよね?でもそれで終わったのでは今回のネタは終了してしまいます。話題をもっと長引かせるためにはやはり平均値を比較するしかないでしょう。。爆!
っということで平均値を比較します。
ではビ〜ク〜〜オープン!!
おぉ!結構な大物が釣れてるじゃないですか!
私の釣果:15、15、15、18、19、22、24、29(cm)
あなたの釣果:15、15、15、16、18、19、20、21、24、30(cm)
あなたは尺釣ってるし20cmオーバーも私が3尾なのに対してあなたは4尾、こりゃ負けたかも知れませんね。
では、この二人の釣果を統計を使って比較してみましょう。
条件設定2
@ 二人は一緒に同じポイントで釣りをしました。
A 二人の釣ったアマゴのサイズは
私:15、15、15、18、19、22、24、29(cm)
あなた:15、15、15、16、18、19、20、21、24、30(cm)
まずは統計の授業で最初に習う「Studentのt検定」を使ってみましょう。
このt検定はまず平均値と分散を計算することから始めます。
平均値は説明する必要ないですね。
分散は平均値とデータ値の差を二乗したものの平均値です。この分散の平方根が標準偏差です。
私が学生だった頃は、電卓はじきながらメモとりながら必死で統計計算したり、少しでも楽しようとBASICでプログラム書いてポケコンに計算させたりしたものですが、時代は進歩し、いまや表計算ソフトで複雑な計算も簡単にできるようになりました。
エクセルに分析ツールをアドインしておけば計算方法を知らなくても簡単に結果を出力してくれます。
っで、最近分析ツールや統計解析サイトのお世話になることが多く、計算の仕方をすっかり忘れてしまいました・・・爆!
とりあえず某統計解析サイトでの検定結果は、p>0.05となり、「二人の釣ったアマゴのサイズには差が有るとも無いとも言えない」っとなりました。
平均サイズでは私が上回ってましたが、見た目はあなたの釣果の方が立派に見えそうです。でも客観的に評価して私の釣果とあなたの釣果には差が有るとも無いとも言えないと言うことのようです。
ちなみにアマゴのように複数の年級群が同時に釣れる場合は、釣ったアマゴのサイズは正規分布しません。だから「サンプルの数が多く、値が正規分布する又は等分散が仮定できる」という前提で用いられる「Studentのt検定」を使うのは好ましくありません。まあ、ハゼ釣りやワカサギ釣りのように同一年級群をお互い何十尾も釣ったって時なんかは「Studentのt検定」で問題有りません。
今回の例題ではサンプル数も少なく、データも正規分布とは言えないので、ほんとうは「マン・ホイットニーのU検定」又は「Welchのt検定 」を用いるのが正解です。
っで、これまた計算方法はすっかり忘れてます。またまた解析サイトのお世話になります・・・。
・・・・計算中・・・・
・・・・計算中・・・・
出ました!これまたp>0.05となり、「二人の釣ったアマゴのサイズには差が有るとも無いとも言えない」っとなりました。どんな手法で検定してもあなたと私の釣果サイズにはたいした差がなかったと言うことです。メデタシメデタシ!
ちなみに「差が有るとも無いとも言えない」というのは「同じである」とは違う意味を持っています。「ちいたぁ大きいが、たいして違ゃぁせんよ」という感じで受け止めればいいでしょう。(厳密には違いますが、説明がまわりくどくなるので・・・笑)
でもやっぱり釣り人ってこの「ちいたぁ大きいが」に拘るんですよねー。しかも「リリースした中にはもっと大物もいたしぃ〜!」っとかほざいたりします。
っということで釣り人は非常に自己中心的であるため釣果を統計解析するのは御法度のようですな。
っといいつつも話題を進めます。
次は腕の優秀さを比較してみましょう。(おっと、これはひょっとして禁断か?)
ここでは腕の優秀さの指標として「釣れた日」と「釣れなかった日」を使いましょう。一日何尾釣ったかは問題にしません。みんなが釣れてない日に釣ってるかどうかが腕ってモンです。
これには生起確率というものを計算します。
生起確率計算には階乗計算が含まれているのでで、メモリー電卓で計算するのが常道です。パソコンの表計算ソフト上で計算式に従ってこれを計算させると、たいていの場合オーバーフローしてしまいます。
まず2×2の升目を作ります。
上の段左から右に向かってa、b、下の段も同様にc、dとします。
この2×2の升目を横と縦にそれぞれ合計し、それをa+b=e、c+d=f、a+c=g、b+d=hとし、e+f又はg+hをnとします。
|
a |
b |
e=a+b |
c |
d |
f=c+d |
g=a+c |
h=b+d |
n |
|
この表ができたら、aに「私に魚が釣れた日数」をbに「私に魚が釣れなかった日数」を、cに「あなたに魚が釣れた日数」を、dに「あなたに魚が釣れなかった日数」を入れます。
そして
P = ( e! f! g! h! ) / ( n! a! b! c! d! )
を計算するだけです。簡単でしょ?
でも、釣行頻度が増えてくるにしたがって、計算がどんどんとめんどくさくなっていきますね。やはりパソコンで計算させる方が良さそうです。
っということで計算式の表現を少し変えてみましょう。
P= eCa × fCc / nCg
このCはエクセルのcombin関数で、セルに書く時には「eCa」は「=combin(e,a)」となります。
ちなみにパソコンに計算させる時は掛け算が先にくると桁が増えすぎてオーバーフローすることがあるので、扱うデータによっては割り算を先に書く方が良いらしいです。
P= fCc / nCg ×eCa
a〜nのセル番地を、
a→B2セル |
b→C2セル |
e→D2セル |
c→B3セル |
d→C3セル |
f→D3セル |
g→B4セル |
h→C4セル |
n→D4セル |
とすると、空いた任意のセルに
=COMBIN(D3,B3)/COMBIN(D4,B4)*COMBIN(D2,B2)
と書き込めば、ここにp値が出力されます。
このp値が0.05より小さければ「二人の釣りの腕に差がないとは言えないけど、サンプル日の抽出を替えたら20回に1回くらいは差がないって結果になるかもね。」ということになるのです。
aに80、bに15、cに90、dに10を入れてみましょう。
これは私の全釣行回数から95回抽出したうち15回がボウズだった、あなたの全釣行回数から100回抽出したら10回がボウズだったことを示すデータです。
抽出した釣行回数に対するボウズの回数が私の方が多いので、みるからに私の方が腕が悪そうですね。
さて、p値はどうなったでしょうか?
|
釣れた日数 |
ボウズの日数 |
|
わたし |
80 |
15 |
95 |
あなた |
90 |
10 |
100 |
計 |
170 |
25 |
195 |
p= |
0.082982 |
> |
0.05 |
おぉ神よ!あなたは私を見捨てなかった〜!
ぅわはは!どうやらあなたと私に釣りの腕の差が無いという期待は捨てきれないようですな。
この検定方法は「Fisherの正確確率検定」と呼ばれるもので、フライパターンや釣り場の良否を評価するにも役立つことは推して知るべしですね。
本日の授業、釣り統計学入門「釣り人(Fisher)の性格確立について」はこれでおわりです。。。ん?
20070410:up
20240304:一部修正