釣り統計学入門

　おまえは何時も小物ばかり釣って喜んでいる

　あいつは何時もオレより大きな魚を釣る

　とかく釣り人は自分の釣果を自慢したり、人の釣果を羨んだりしがちです。

　でも釣果の差って何なんでしょうね？

　釣れた魚のサイズ？釣れた魚の数？

　漠然とした基準で大物が釣れたとか沢山釣れたとか言ってますよね。

　同じ釣果でも立場によってオレの方が上だとかいやいやたいしてかわらんとか、評価が分かれてしまうのが釣り人界の常でしょう。

　これを個人的な感情や感覚でなく客観的に評価できるようにしようというのが今回の話題です。

　釣果に限らず、世の中で起こっている事象を言葉だけで表現すると、どうしても個人の気持ちや評価が入り込み、客観的な評価とはなり難いものです。

　しかしここで数字を用いることで客観的な評価ができるようになります。

　空間と形を客観的に表す言語として幾何学があったように変化や違いを客観的に表す言語として統計学があるのです。

　まずは釣った魚のサイズを比較してみましょう。

　とりあえず被験者はこれを読んでいるあなたとこれを書いている私と言うことにしましょう。

条件設定１

①　二人は一緒に同じポイントで釣りをしました。

②　二人とも１尾づつ釣りました。

　このケースでは、二人の釣った魚のサイズの比較は１：１なので非常に簡単です。

　では二人がそれぞれ１５尾と２０尾のアマゴを釣ったとしましょう。

　でも全部持って帰っても仕方ないのでランダムにリリースとキープを繰り返し、最終的に私の魚篭に８尾、あなたの魚篭に１０尾のアマゴが入っていたとしましょう。

　さて、この二人の釣果、何をどうやって比較すればどちらの釣果が大物だったといえるでしょうか？

　最大サイズの比較というのも一つの手でしょう。

　平均サイズの比較という手もあります。

　一般的に釣り大会では大物を比較しますよね？でもそれで終わったのでは今回のネタは終了してしまいます。話題をもっと長引かせるためにはやはり平均値を比較するしかないでしょう。。爆！

　っということで平均値を比較します。

　ではビ～ク～～オープン！！

　おぉ！結構な大物が釣れてるじゃないですか！

　私の釣果：１５、１５、１５、１８、１９、２２、２４、２９(cm)

　あなたの釣果：１５、１５、１５、１６、１８、１９、２０、２１、２４、３０(cm)

　あなたは尺釣ってるし２０ｃｍオーバーも私が３尾なのに対してあなたは４尾、こりゃ負けたかも知れませんね。

　では、この二人の釣果を統計を使って比較してみましょう。

条件設定２

①　二人は一緒に同じポイントで釣りをしました。

②　二人の釣ったアマゴのサイズは

　私：１５、１５、１５、１８、１９、２２、２４、２９(cm)

　あなた：１５、１５、１５、１６、１８、１９、２０、２１、２４、３０(cm)

　まずは統計の授業で最初に習う「Studentのｔ検定」を使ってみましょう。

　このｔ検定はまず平均値と分散を計算することから始めます。

　平均値は説明する必要ないですね。

　分散は平均値とデータ値の差を二乗したものの平均値です。この分散の平方根が標準偏差です。

　私が学生だった頃は、電卓はじきながらメモとりながら必死で統計計算したり、少しでも楽しようとBASICでプログラム書いてポケコンに計算させたりしたものですが、時代は進歩し、いまや表計算ソフトで複雑な計算も簡単にできるようになりました。

　エクセルに分析ツールをアドインしておけば計算方法を知らなくても簡単に結果を出力してくれます。

　っで、最近分析ツールや統計解析サイトのお世話になることが多く、計算の仕方をすっかり忘れてしまいました・・・爆！

　とりあえず某統計解析サイトでの検定結果は、p>0.05となり、「二人の釣ったアマゴのサイズには差が有るとも無いとも言えない」っとなりました。

　平均サイズでは私が上回ってましたが、見た目はあなたの釣果の方が立派に見えそうです。でも客観的に評価して私の釣果とあなたの釣果には差が有るとも無いとも言えないと言うことのようです。

　ちなみにアマゴのように複数の年級群が同時に釣れる場合は、釣ったアマゴのサイズは正規分布しません。だから「サンプルの数が多く、値が正規分布する又は等分散が仮定できる」という前提で用いられる「Studentのｔ検定」を使うのは好ましくありません。まあ、ハゼ釣りやワカサギ釣りのように同一年級群をお互い何十尾も釣ったって時なんかは「Studentのｔ検定」で問題有りません。

　今回の例題ではサンプル数も少なく、データも正規分布とは言えないので、ほんとうは「マン・ホイットニーのＵ検定」又は「Welchのｔ検定」を用いるのが正解です。

　っで、これまた計算方法はすっかり忘れてます。またまた解析サイトのお世話になります・・・。

・・・・計算中・・・・

　出ました！これまたp>0.05となり、「二人の釣ったアマゴのサイズには差が有るとも無いとも言えない」っとなりました。どんな手法で検定してもあなたと私の釣果サイズにはたいした差がなかったと言うことです。メデタシメデタシ！

　ちなみに「差が有るとも無いとも言えない」というのは「同じである」とは違う意味を持っています。「ちいたぁ大きいが、たいして違ゃぁせんよ」という感じで受け止めればいいでしょう。（厳密には違いますが、説明がまわりくどくなるので・・・笑）

　でもやっぱり釣り人ってこの「ちいたぁ大きいが」に拘るんですよねー。しかも「リリースした中にはもっと大物もいたしぃ～！」っとかほざいたりします。

　っということで釣り人は非常に自己中心的であるため釣果を統計解析するのは御法度のようですな。

っといいつつも話題を進めます。

　次は腕の優秀さを比較してみましょう。（おっと、これはひょっとして禁断か？）

　ここでは腕の優秀さの指標として「釣れた日」と「釣れなかった日」を使いましょう。一日何尾釣ったかは問題にしません。みんなが釣れてない日に釣ってるかどうかが腕ってモンです。

　これには生起確率というものを計算します。

　生起確率計算には階乗計算が含まれているのでで、メモリー電卓で計算するのが常道です。パソコンの表計算ソフト上で計算式に従ってこれを計算させると、たいていの場合オーバーフローしてしまいます。

　まず２×２の升目を作ります。

　上の段左から右に向かってａ、ｂ、下の段も同様にｃ、ｄとします。

ａ	ｂ
ｃ	ｄ

　この２×２の升目を横と縦にそれぞれ合計し、それをａ＋ｂ＝ｅ、ｃ＋ｄ＝ｆ、ａ＋ｃ＝ｇ、ｂ＋ｄ＝ｈとし、ｅ＋ｆ又はｇ＋ｈをｎとします。

ａ	ｂ	e=a+b
ｃ	ｄ	f=c+d
g=a+c	h=b+d	n

　この表ができたら、ａに「私に魚が釣れた日数」をｂに「私に魚が釣れなかった日数」を、ｃに「あなたに魚が釣れた日数」を、ｄに「あなたに魚が釣れなかった日数」を入れます。

　そして

P = ( e! f! g! h! ) / ( n! a! b! c! d! )

を計算するだけです。簡単でしょ？

　でも、釣行頻度が増えてくるにしたがって、計算がどんどんとめんどくさくなっていきますね。やはりパソコンで計算させる方が良さそうです。

　っということで計算式の表現を少し変えてみましょう。

P= eCa × fCc / nCg

　このCはエクセルのcombin関数で、セルに書く時には「eCa」は「=combin(e,a)」となります。

　ちなみにパソコンに計算させる時は掛け算が先にくると桁が増えすぎてオーバーフローすることがあるので、扱うデータによっては割り算を先に書く方が良いらしいです。

P= fCc / nCg ×eCa

　ａ～ｎのセル番地を、

ａ→B2セル	ｂ→C2セル	ｅ→D2セル
ｃ→B3セル	ｄ→C3セル	ｆ→D3セル
ｇ→B4セル	ｈ→C4セル	ｎ→D4セル

とすると、空いた任意のセルに

＝COMBIN(D3,B3)/COMBIN(D4,B4)*COMBIN(D2,B2)

と書き込めば、ここにp値が出力されます。

　このp値が0.05より小さければ「二人の釣りの腕に差がないとは言えないけど、サンプル日の抽出を替えたら２０回に１回くらいは差がないって結果になるかもね。」ということになるのです。

　ａに８０、ｂに１５、ｃに９０、ｄに１０を入れてみましょう。

　これは私の全釣行回数から９５回抽出したうち１５回がボウズだった、あなたの全釣行回数から１００回抽出したら１０回がボウズだったことを示すデータです。

　抽出した釣行回数に対するボウズの回数が私の方が多いので、みるからに私の方が腕が悪そうですね。

　さて、p値はどうなったでしょうか？

	釣れた日数	ボウズの日数
わたし	80	15	95
あなた	90	10	100
計	170	25	195
p=	0.082982	＞	０．０５

　おぉ神よ！あなたは私を見捨てなかった～！

　ぅわはは！どうやらあなたと私に釣りの腕の差が無いという期待は捨てきれないようですな。

　この検定方法は「Fisherの正確確率検定」と呼ばれるもので、フライパターンや釣り場の良否を評価するにも役立つことは推して知るべしですね。

本日の授業、釣り統計学入門「釣り人（Fisher）の性格確立について」はこれでおわりです。。。ん？

20070410：up

20240304：一部修正　

釣りに行くメニューに戻る

又七の屋敷メインメニューへ戻る