こんにちは、野球ブロガーのなおしー(@naoc2520) です。
さて、プロ野球は開幕から2カードが終了しました。
各チーム、投手ローテーションも1周しています。
ということで、この2カードの結果からピタゴラス勝率を使って今シーズンのプロ野球を予想していきたいと思います。
ピタゴラス勝率とは?
ピタゴラス勝率とは野球の統計学セイバーメトリクスの指標のひとつで、チームの総得点と総失点から導かれる式です。
ピタゴラス勝率は次の式で表されます。
分数がありますがとても簡単な式ですよね。
式の性質として、
- 得点が増えるとピタゴラス勝率は大きくなる
- 失点が増えるとピタゴラ勝率は小さくなる
- 得点と失点が等しいときピタゴラス勝率は 1/2 になる
ということがわかります。
ピタゴラス勝率はアメリカのスポーツライターであるビル・ジェームズが考案した指標で、得点と失点を勝利に換算するための代表的なものです。
ピタゴラス勝率という名前は、式の形が数学のピタゴラスの定理(三平方の定理)を連想させるためそうついたそうです。
英語では「Pythagorean Expectation」、日本語では「ピタゴリアン勝率」とか「ピタゴラス期待値」とも呼ばています。
ピタゴラス勝率の実力
では、実際にピタゴラス勝率がどのようなものなのかを見ていきたいと思います。
2016年のセ・リーグのチームデータを使いましょう。
得点、失点、ピタゴラス勝率、勝率を表にすると次のようになります。
|
得点 |
失点 |
ピ勝率 |
勝率 |
差 |
広島 |
684 |
497 |
0.654 |
0.631 |
0.023 |
巨人 |
519 |
543 |
0.477 |
0.507 |
0.030 |
DeNA |
572 |
588 |
0.486 |
0.493 |
0.007 |
阪神 |
506 |
546 |
0.462 |
0.457 |
0.005 |
ヤクルト |
594 |
694 |
0.423 |
0.451 |
0.028 |
中日 |
500 |
573 |
0.432 |
0.414 |
0.018 |
ピタゴラス勝率と勝率の差は大きくて0.03でしたが、おおむね勝率に近い値になっているのではないでしょうか?
このように、得点と失点という簡単な数値だけで勝率に近い値を求められるのでこのピタゴラス勝率は有用であると言われています。
ちなみに、ピタゴラス勝率と勝率の差が大きくなる理由は大勝ちしていたり大負けしている試合があるためです。
ピタゴラス勝率の場合は総得点と総失点という均した数値を使うので、極端に得失点の差が開いた試合があると実際の勝率とのブレが大きくなります。
例えば、巨人とヤクルトはピタゴラス勝率が勝率より小さくでているので、負ける試合で大きく失点しているものと思われます。
ピタゴラス勝率で2017年を予想すると?
それでは実際に開幕2カード(5~6試合)のデータを使ってピタゴラス勝率を求めてみたいと思います。
あくまでもたった2カードの成績なので、参考程度でご覧いただきたいと思います。
セ・リーグ
順位 |
チーム |
得点 |
失点 |
ピ勝率 |
ピ順位 |
1 |
巨人 |
27 |
15 |
0.764 |
1 |
2 |
広島 |
39 |
26 |
0.692 |
2 |
3 |
阪神 |
29 |
32 |
0.451 |
4 |
4 |
ヤクルト |
26 |
22 |
0.583 |
3 |
5 |
DeNA |
20 |
29 |
0.322 |
5 |
6 |
中日 |
14 |
31 |
0.169 |
6 |
実際の順位とピタゴラス勝率の順位を書いています。
ピタゴラス勝率上は阪神とヤクルトの順位が入れ替わるということになりました。
理由は阪神に6試合で延長戦になった接戦が2試合あり、さらに1ー9と大敗した試合もあったためだと思われます。
逆に言うと、ヤクルトは9ー2で勝った試合がありピタゴラス勝率勝率は大きくでています。
こう見ると、ピタゴラス勝率との差が大きいと効率よく勝っているとか投打が噛み合っているということになるのかなと思います。
これについてはまたデータが増えてきたら検証してみたいと思います。
心配なのは中日です。
得点はリーグ最下位、失点はリーグ5位とかなりひどい状況です。
実際の試合ではいまだに未勝利、ピタゴラス勝率上も2割勝てないという結果になってしまいました。
パ・リーグ
順位 |
チーム |
得点 |
失点 |
ピ勝率 |
ピ順位 |
1 |
楽天 |
38 |
29 |
0.632 |
2 |
2 |
ソフトバンク |
29 |
19 |
0.700 |
1 |
3 |
西武 |
18 |
16 |
0.559 |
3 |
4 |
オリックス |
21 |
27 |
0.377 |
4 |
5 |
日本ハム |
20 |
28 |
0.338 |
6 |
6 |
ロッテ |
18 |
25 |
0.341 |
5 |
パ・リーグはピタゴラス勝率の順位が大きく変わりました。
ソフトバンクは楽天相手に15ー4で勝った試合が強く影響していると思われます。
まとめ
ピタゴラス勝率を使って開幕2カードのデータから順位を予測した結果、セ・リーグは
- 巨人
- 広島
- ヤクルト
- 阪神
- DeNA
- ヤクルト
パ・リーグは
- ソフトバンク
- 楽天
- 西武
- オリックス
- ロッテ
- 日本ハム
ということになりました。
今回は5~6試合という少ないデータでしたが、試合が進んでデータが増えるともっと予想が深くなってくると思います。
対戦カードが1回りくらいしたいところでもう一回計算してみるといいと思います。
それから、次回は勝率とピタゴラス勝率の差についても考えてみたいと思います。
野球の統計学、セイバーメトリクスについてはこの本が入門書としておすすめです!
鳥越 規央,データスタジアム野球事業部 岩波書店 2014-03-13