スコア関数

私の研究はスコアが出てきて、そのスコアが大きいか小さいかで解析したパターンがGoodかBadか判定するっていう、これだけ言えば単純な研究だ
#いろいろ苦労はしてるけど・・・
今までのスコアのつけ方だと、現在使ってるコーパスでスコアが0点から3800点の間で上下する・・・とてもじゃないが切れたもんじゃないorz

そんなわけで事象を確率的に捉えて、その分布を用いたスコア計算を・・・どこかで聞いたような研究だな;
とりあえず、目に付いた有名な分布でポアソン分布なんかがいいなぁなんて

f(x)=\frac{\mu^x}{x!}e^{-\mu}
ポアソン分布\mu:データの平均値

ノート1ページ使ってアルゴリズム書いて、さぁ実装だ!

f(200)=\frac{\mu^{200}}{200!}e^{-\mu}

お察しくださいorz

実際は

この関数は+∞の極限で0に収束するので、実際は0としてよいのですが
実際にほしい値は

p(x)=\sum^{x}_{k=0}f(k)

になります。
ある程度で1に飽和するはずなんですが、
その"ある程度"が\muによって変わってくるので、100超えたらーとかそういう観点でやってしまうといけないわけで
つまり"ある程度"を\muの関数にして、それ以上は打ち切りに・・・

もう少しお勉強が必要そうですね、私orz