こんにちは、なおしー(@naoc2520) です
プロ野球って色んなタイプの選手がいますよね。
長打力のある選手、守備の上手い選手、足の速い選手などなど。
ときどきすべてが揃ったオールマイティな選手もいますが、基本的にはそれぞれの傾向によって長所や短所があると思います。
では例えば、ホームランバッターについてはどのようなイメージをお持ちでしょうか?
長打力があるのはもちろんですが、他には?
記録に残るもので考えると足が遅く大振りするイメージから
- 三振が多い
- 四死球が多い
- 盗塁が少ない
- 併殺が多い
などがあるのではないでしょうか。
今日はホームランバッターに対するこれらのイメージがどれほど正しいのかについてセンター数学の知識を使って考えたいと思います。
準備
今回は2016年のシーズンの中で、規定打席に到達した選手55名のデータを使います。
例えば本塁打数の上位10人を並べるとこんな感じになります。
本塁打 | 三振 | 四死球 | 盗塁 | 併殺 | |
---|---|---|---|---|---|
筒香 嘉智 | 44 | 105 | 90 | 0 | 6 |
レアード | 39 | 138 | 47 | 0 | 16 |
山田 哲人 | 38 | 101 | 105 | 30 | 16 |
メヒア | 35 | 148 | 65 | 1 | 15 |
ロペス | 34 | 75 | 28 | 0 | 12 |
バレンティン | 31 | 116 | 75 | 0 | 19 |
鈴木 誠也 | 29 | 79 | 56 | 16 | 10 |
ウィーラー | 27 | 123 | 70 | 2 | 10 |
松田 宣浩 | 27 | 141 | 56 | 6 | 14 |
村田 修一 | 25 | 83 | 43 | 1 | 21 |
これをざっと見ても一概にどうとはいい切れませんね。
基準となる本塁打数もバラバラなのでこの表を見ただけで判断するのは難しいです。
相関係数を調べる
そこで相関係数という指標を使ってみたいと思います。
これは、センター数学のデータの分析という単元で登場するもので、2組のデータの関係の強さを表すものです。
相関係数は定義上ー1から1までの値をとり、1に近いほど「正の相関がある」といい-1に近いほど「負の相関がある」といいます。
相関という言葉は比例という言葉と近い意味だと思ってください。
例えば「身長と体重には正の相関がある」ということは「体重が思い人ほど身長も高い傾向がある」 といっているようなものです。
相関係数を求めるのはデータが増えるほど計算が大変になります。
今回は55人もいるのでエクセルの関数を使いました。
手計算での求め方についてはこちらのサイトを参考にしてみてください。
エクセルには相関係数を求める関数が最初から入っていて
CORREL(データ群1,データ群2)
という関数で求めることが出来ます。
ではこの関数で計算した結果を見てみましょう。
三振 | 盗塁 | 併殺 | 四死球 | |
---|---|---|---|---|
本塁打 | 0.566 | -0.197 | 0.426 | 0.176 |
このように最も相関が強いのは三振ということになりました。
また盗塁のみ値がマイナスになっており、本塁打の多い選手は盗塁が少ない傾向があることも計算でわかります。
マイナスを踏まえて考えると、本塁打数との関係は
- 三振が多い
- 併殺が多い
- 盗塁が少ない
- 四死球が多い
の順に強いということがわかりました。
ホームランバッターほど攻めが厳しくなると思っていたのですが、意外と四死球は関係が低いようです。
ちなみにこれ以外のものもいくつか調べてみました。
すると、二塁打数との相関係数が0.480、三塁打数との相関係数が-0.221という結果になり、本塁打が多い選手は二塁打も多く一方で三塁打は少ないということがわかりました。
さいごに
実際のセンター試験ではこのデータの分析が2年ほど前から出題されています。
相関係数を求めるというよりはグラフをみて相関の強さを答える問題などが出題されています。
相関を見るグラフについては私も以前リライトについての記事でアイデアを使いました。
今回は若干ネタ切れ感があり無理矢理になりましたが、相関係数自体はこんな遊びで使うのがもったいないくらいいい指標だと思います。
使いこなせばザーッとデータを眺めるだけではわからない意外な発見ができるかもしれませんよ。
今回は「センター数学×野球」の第4弾です。
第5弾はこちらです。
意外と読んでいただいている第1弾~第3弾は次の記事をご覧ください。