修士慣れてきました。最近考えてることとか
久し振りの更新です(笑)
卒業研究が忙しくなったあたりから辞めていたけど、また気が向いたら書いていこうかな。
一応近況報告すると、去年大学卒業後、他大学の大学院に進学して今は統計学の研究をしています。
そういう内容はスライドとかにしようと思っているけど、たまには投稿するかも。
今日は大学院進学してからのことを少し書こうかな。
僕は4年のときと今ではやっている内容が違うので、日々新しいことが学べて最近は統計だったり数学の勉強がかなり楽しくなってきてる。
けれど、さすがにわからないことが多すぎて行間が読めなかったり、あえて読まずに先に進んだりしてしまったりしていた(笑)
最近になって気づいたのは、意味が分からなくても答えがあっていたからいいやって考えを大学生、修士学生レベルの内容でやると先に進んだ時に全く分からなくなるってこと。
初めは「答えはわかる」という状況だけれど、次第に答えもわからなくなって、何をやっているのかもわからなくなる。
特に数学だと、そういう状況は最悪で、答えが分かる状況ならまだその問題は解けるけれど、全く応用できないし、何をやっているかもわからなくなると、もうどうしようもない。
そんな状況だと人に聞いたとしても、何を聞いたらいいのかもわからない。
だからなのかな、数理系の大学教員は(今までの僕の指導教員がそうだっただけかもしれないけれど)言葉を当てにしてないというか、数式できちんと記述できないことは認めてくれないことが多い。
最近「数学は暗記」みたいなことを言っているツイートを見ることがあったけれど、暗記というのが丸暗記のことだったら、それどうまくいくのはセンター試験レベルくらいまでじゃないかと思う。
それ以上の内容が分かるためには、どうしても式の意味だったり問題を解くための方針なんかが分かっていないといけない。
だから暗記というのが上のようなことを覚えるってことだったら暗記って言ってもいいのかもしれないなって思ってる。
数学の話はこの辺にして、何が言いたいかって、何かをする時に、もしまじめに取り組みたいと思っていることだったら、それに対して真摯な姿勢で、かつ内容を厳密に理解しようとして取り組まないと何も身につかないなって最近は考えてる。
野球をやっていた頃の自分に言いたいのは、雑な練習とかしなくていいからもっと基本的で重要なことをやれ(笑)ってことかな。
最近は統計が楽しいからそっちを頑張ります。
久し振りだったし今回はこの辺でおしまい。
そのうちまた野球データの分析とかもやっていけたらなって考えてます。
ではまた!
Rで散布図行列を書く方法
データを可視化するのに使える散布図行列を書く方法のメモです。
散布図行列とはこんな感じのものです。
このようにグラフの行列を作ります。
行列の右上部分が相関係数、左下部分が散布図、真ん中がヒストグラムと確率密度になっています。
グラフを作るにはpsychを使うのが簡単だと思います。
初回だけパッケージをインストール
install.packages(psych)
あとはこのようにすれば散布図行列を書いてくれます。
library(psych) d = read.csv(file="データ") pairs.panels(d,smooth=TRUE or FALSE, density=TRUE or FALSE, ellipses=TRUE or FALSE, scale=TRUE or FALSE, pch=".")
引数はこんな感じです。詳しくはこちら
# 散布図のプロット(斜体文字は任意指定のオプションで意味は以下のコメントを参照方)
# smooth : 平滑線の描画の有無(TRUEで描画)
# density : ヒストグラムでの密度カーブの描画の有無(TRUEで描画)
# ellipses : 散布図上での相関円の描画の有無(TRUEで描画)
# scale : 相関係数の文字の大きさを相関の強さで変えるか否か(TRUEで文字の大きさを変える)
# pch="." : サンプル数が多い場合に素早く描画する
参考ページ
pairs.panels() - (ソフトウェア品質技術者のための)データ分析勉強会
[はてな記法]ソースコードを色付けして表示する(シンタックスハイライト) - はてなブログ ヘルプ
今回はここまでです。
③三振を取れる投手は良い投手なのか(一般化マンテル検定)
盗塁は得点に影響しない?まさかの結果、、、
前回はに引き続き、何が得点に結びつくのか考えていきたいと思います。前回はこちらから
出塁率を高めることが得点を増やし、勝利につながることはわかりました。次は「ランナーを進める」ことが浮かぶと思います。進め方は打って進める、送りバントをする、盗塁する、エンドランをする、などがあると思いますが今回は盗塁について考えてみましょう。
なぜなら盗塁はアウトになるリスクが大きく、リスクに見合うだけの価値があるのか気になったからです。
まずプロ野球ではどのくらい盗塁に成功するのでしょうか?
2014年~2016年での盗塁成功率は約7割です(データ元:Baseball LAB)。
これはかなり高い数字ではないでしょうか。確率でいえば7割の確率で塁を1つ進めるのです。
しかし、これはプロ選手たちがキャッチャーの肩や自分の走力などを考えて、ある程度成功できるという確信があってのデータなので、むやみやたらに盗塁すると盗塁成功率はもっと下がってしまうかもしれません。
盗塁というのはそれくらい高いリスクの行為なのです。
盗塁のリスクの高さが分かったところで、一試合当たりの盗塁成功数の平均と得点の平均の散布図を見てみましょう。
前回の出塁率と比べるとどうでしょうか。前とは違いかなりばらつきがあります。これは「盗塁をたくさん決めても、得点には結びつかない」と考えることができます。
これではリスクを取って盗塁をたくさんしても、あまり効果はないのかもしれません。しかし、盗塁が高確率で成功するなら、より多くの点が取れるのではないでしょうか。
そこで、盗塁の成功率と得点の平均を比べてみましょう。
先ほどの盗塁数と比べた場合よりは得点が増えているかもしれませんが、盗塁成功率の場合でもそれほど変わりません。
つまり、「盗塁は成功率が高くても、得点には結びつかない」と考えられます。
考察
試合に勝つには盗塁の技術はあまり重要ではないようです。
前回やった出塁率の方が圧倒的に得点に結びつくので、試合に勝ちたい選手は盗塁よりも出塁率を高めるための練習をした方が成果が出ると思います。
今回の引用・参考
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
Twitterにて、更新状況をつぶやきます。
セイバーメトリクスについて考えてみます
— keih@野球選手のセイバーメトリクス (@bb_keih) October 27, 2016
質問・意見等はTwitterでお願いします。