チーム打撃力をパリーグ優勝チームで見てみよう

 

プロ野球ペナントレースで優勝するようなチームってどんなチームなのかなって思って調べてみました。

普段やってる統計手法を使ってみたいなっていうのもあったので、一石二鳥です(笑)

 

データは日本野球機構のものでパリーグ2016年から過去30年間のものを使ってみました。

http://npb.jp/bis/yearly/

元データが気になる方はここからどうぞ

 

======================================= 

続きを読む

修士慣れてきました。最近考えてることとか

久し振りの更新です(笑)

卒業研究が忙しくなったあたりから辞めていたけど、また気が向いたら書いていこうかな。

一応近況報告すると、去年大学卒業後、他大学の大学院に進学して今は統計学の研究をしています。

そういう内容はスライドとかにしようと思っているけど、たまには投稿するかも。

 

 

今日は大学院進学してからのことを少し書こうかな。

 

僕は4年のときと今ではやっている内容が違うので、日々新しいことが学べて最近は統計だったり数学の勉強がかなり楽しくなってきてる。

 

けれど、さすがにわからないことが多すぎて行間が読めなかったり、あえて読まずに先に進んだりしてしまったりしていた(笑)

 

最近になって気づいたのは、意味が分からなくても答えがあっていたからいいやって考えを大学生、修士学生レベルの内容でやると先に進んだ時に全く分からなくなるってこと。

 

初めは「答えはわかる」という状況だけれど、次第に答えもわからなくなって、何をやっているのかもわからなくなる。

 

特に数学だと、そういう状況は最悪で、答えが分かる状況ならまだその問題は解けるけれど、全く応用できないし、何をやっているかもわからなくなると、もうどうしようもない。

 

そんな状況だと人に聞いたとしても、何を聞いたらいいのかもわからない。

 

だからなのかな、数理系の大学教員は(今までの僕の指導教員がそうだっただけかもしれないけれど)言葉を当てにしてないというか、数式できちんと記述できないことは認めてくれないことが多い。

 

最近「数学は暗記」みたいなことを言っているツイートを見ることがあったけれど、暗記というのが丸暗記のことだったら、それどうまくいくのはセンター試験レベルくらいまでじゃないかと思う。

 

それ以上の内容が分かるためには、どうしても式の意味だったり問題を解くための方針なんかが分かっていないといけない。

 

だから暗記というのが上のようなことを覚えるってことだったら暗記って言ってもいいのかもしれないなって思ってる。

 

数学の話はこの辺にして、何が言いたいかって、何かをする時に、もしまじめに取り組みたいと思っていることだったら、それに対して真摯な姿勢で、かつ内容を厳密に理解しようとして取り組まないと何も身につかないなって最近は考えてる。

 

野球をやっていた頃の自分に言いたいのは、雑な練習とかしなくていいからもっと基本的で重要なことをやれ(笑)ってことかな。

 

最近は統計が楽しいからそっちを頑張ります。

 

久し振りだったし今回はこの辺でおしまい。

そのうちまた野球データの分析とかもやっていけたらなって考えてます。

 

ではまた!

 

ピタゴラス勝率は正しいか?

要約

ビルジェームズが考えたピタゴラス勝率が勝率の推定値として正しいかどうかの判定をしたい。過去3年間のプロ野球のデータを用いた分析を行った結果、ピタゴラス勝率は勝率の推定値として有効だと考えられると分かった。

 

もくじ

はじめに

ピタゴラス勝率の数式

方法

データについて

結果

参考

続きを読む

Rで散布図行列を書く方法

データを可視化するのに使える散布図行列を書く方法のメモです。

散布図行列とはこんな感じのものです。

f:id:keih87:20170119201542p:plain


このようにグラフの行列を作ります。

行列の右上部分が相関係数、左下部分が散布図、真ん中がヒストグラムと確率密度になっています。

グラフを作るにはpsychを使うのが簡単だと思います。

初回だけパッケージをインストール

install.packages(psych)

あとはこのようにすれば散布図行列を書いてくれます。

library(psych)
d = read.csv(file="データ")
pairs.panels(d,smooth=TRUE or FALSE, density=TRUE or FALSE, ellipses=TRUE or FALSE, scale=TRUE or FALSE, pch=".")


引数はこんな感じです。詳しくはこちら

# 散布図のプロット(斜体文字は任意指定のオプションで意味は以下のコメントを参照方)
# smooth : 平滑線の描画の有無(TRUEで描画)
# density : ヒストグラムでの密度カーブの描画の有無(TRUEで描画)
# ellipses : 散布図上での相関円の描画の有無(TRUEで描画)
# scale : 相関係数の文字の大きさを相関の強さで変えるか否か(TRUEで文字の大きさを変える)
# pch="." : サンプル数が多い場合に素早く描画する



参考ページ
pairs.panels() - (ソフトウェア品質技術者のための)データ分析勉強会
[はてな記法]ソースコードを色付けして表示する(シンタックスハイライト) - はてなブログ ヘルプ


今回はここまでです。

③三振を取れる投手は良い投手なのか(一般化マンテル検定)

 

前回の続きです。

keih87.hatenablog.com

 

前回はセ・パリーグに分けて考えてみました。その結果、三振を取れる投手は防御率が低い傾向にあることが分かったと思います。

 

では、三振は取れれば取れるだけ良いのでしょうか。今回はその点について考えてみます。

 

結論

続きを読む

②三振を取れる投手は良い投手なのか

 

前回の続きです。

keih87.hatenablog.com

 

 

前回は2016年のセリーグのデータを使って三振が取れる投手が点を取られにくいということを見ていきましたが、それは「2016年」の「セリーグ」という風に条件が付いています

 

 

もしかしたら「2010年」のデータや「パリーグ」のデータを使って推測すると違った結果になってしまうかもしれません。

 

 

もし前回の結果が間違っていたら大変です。今回は「パリーグ」のデータも使うことでリーグ全体での推測をしてみましょう。

続きを読む

三振が取れる投手は良い投手なのか

 

良い投手の定義は人それぞれですが、今回はとりあえずより点が取られない投手を良い投手と考えることにしましょう。

 

世の中には三振をたくさん取れる投手がいます。メジャーリーグで5714三振奪ったノーラン・ライアンは生涯勝率は0.526、生涯防御率は3.19となっています。

 

 

日本のプロ野球でもメジャーリーグでも最優秀防御率が3点台というのはほとんどありません。もし三振をたくさん取れる投手が良い投手であるなら、ノーラン・ライアン防御率はもっと低くなったのではないでしょうか。

続きを読む