Androidマンになりたいおじさん

自分の備忘録的なのです。Androidを普及できたらいいなと思ったりしながら書きます

アプリエンジニアだけど統計学入門してみた

はじめに

こんにちは!!!!

最近パスタにハマりすぎて、パスタしか食べてないぐみおじです!!!

最近統計学を学び始めたので、その背景と目標とか読んだ本とか緩く書けたらいいかなーくらいに今書きながら思ってます

Let's Statistics

なぜ統計学か?

改めて、自分は普段はAndroidアプリエンジニアを仕事としてしています。

半年近くはUI/UX向上のために自分たちor誰かの施策考案 -> 実装 -> 運用 ->効果検証のため、分析(してもらう) -> 振り返り -> 適用 or 差し戻しをくるくるしてました。ミニマムグロースエンジニア的なやつですね

グロースエンジニアってなんやねんって人はこちらで雰囲気わかります note.com

今はストリーミングクライアントチームってとこにいて、ざっくりと動画視聴品質向上のために施策・検証をしたり、Androidのプレイヤー保守・運用・機能開発をしたりするとこです。上で述べていた対象が表面的なものから少しコアなものに変わっただけでやってることは結構似ていたりします。

弊社にはそれはそれは優秀なデータサイエンティストがたくさんいるわけなんですが、それって軽めな分析、検証、データ整理を依頼して、タスクを何個も詰むの違うくない??って思いました

自分はチームでものづくりするのがすごく好きです。自分にはできない様々な能力を持った人がいて、掛け算でいいものって出来ていくとおもってます。みんなすごいです、尊敬です

なので、データサイエンティストにはデータサイエンティストにしか出来ないほんとに難しい専門の仕事をしてほしいので、少しかじったら出来そうな仕事は自分で吸収して、片付けたいと思うわけですね。結果的に自分のスキルも向上するんですし、自分は割とwin-winとか思ってるんですが、どうなんでしょうね :thinking_face:

と!だらだら話しましたが自分で何かしらのアイデア検証して、分析して、やったー!!ってサイクルまわしたいから統計学学ぼうと思ったきっかけです

目標

直近の目標は自分でA/Bテストを実施して、検証ができるようになることです

ゴール設定は統計検定2級に受かることです -> 一応、色々調べていたら統計検定とかいうものがあって、2級は大学基礎統計学くらいのいい感じのレベルらしいです

www.toukei-kentei.jp

目標は言ったほうが楽だし、言うだけタダだから言っていきましょう(?)

どうやって学ぶか

他のサイトやレビューとか参考にしながら、自分に合いそうなのをチョイスしました

上から順番にやっていく予定です

完全独習統計学入門 所要時間: 7hくらい

統計学ってめっちゃ数学のイメージ強いじゃないですか?実際そうなんですけど、、、

別に数学アレルギーとかじゃないんですが、数式たくさんいきなり突っ込まれると「う''っっっっ」ってオタクみたいな反応になるので、数式全然出てこないのからやんわり全体概要把握したいなーって人にほんとに向いてました

すごく丁寧で色んな例え話や、皆さん大好き金融商品の話とかもあって、統計学がサクサクと楽しく学べるなーという印象でした。個人的には間違いなく最初に読んで正解と思ってます

マンガでわかる統計学 所要時間: 2 ~ 6hくらい

タイトルの通り!上の独習やってたら、読む必要はないかなと思いましたが、独習には書いてないことを数式かつ、マンガでわかりやすく書いてくれているので復習のために読んでみるのはありかもしれませんね

統計学の全体概要把握のためなんで、独習でもマンガでもどっちでも大丈夫という感想でした

統計学入門 所要時間: 多分35 ~ 40hくらい

東大の赤本とかいうやつですね、これはまだ読んでる途中なのでペース的にこのくらい時間かかりそうだなーっていう時間で書いてます。

これ読んでたら、統計学完全に入門したと言ってもいいくらいのレベルで統計検定2級も余裕の余裕よって誰かが言ってました(誰でしょうね)

確かに読み応えがあって、章末に実用的な問題などがあって、それらもしっかりとやっていくと結構力つきそうだなーって思いました。東大...ひぇぇ...ってならないくらいに優しく読める構成になってるので身構えなくても大丈夫そうでした

正直これ1冊で充分なんですが、アレルギー発動しちゃう人は上記かそれ以外の何かしらの優しめな統計学入門は軽くしといたほうがいいかもとは思いました!!!

これ読み終わったら、統計検定受けてみるつもりなので、そのときはまたブログ書きますね

Pythonで学ぶあたらしい統計学の教科書 所要時間: 多分20 ~ 30hくらい

統計学の知識ばかりinputしても実用できるかーーーー!ってなるんで、上の赤本と並行して手を動かして統計学実践できるおすすめ本を同期のデータサイエンティストに聞いたらこれ推してもらいました。

確かにいい本で、実際に学んだ統計学の知識をPythonで計算して、可視化したり、検定する方法を教えてくれます。用語解説とかもしっかりしてくれているので、最初にこれをやってもいいかもしれませんとは思いました。

結構ボリューミーかつ、手を動かしてやると時間結構経ちます....

東京大学のデータサイエンティスト講座 所要時間: 知らん

まだ1ページも読んでないから、しらん!タイムリーで半額になってたから勢いで買っただけ!

でもちゃんと読むから安心してくれ。結構良書らしい

統計学基礎知識 -> Pythonで実装・可視化練習 -> データサイエンティストの全体概要

といった感じで進んでいく予定なので、系統的にはOKだと思ってます(適当)

統計学は割と学んでて損はないと思った

当初の目的は分析、検証だったんですが学びはじめたら意外とおもしろくて、自分は赤本まで手を出してます....。Pythonが全部やってくれる優秀な子なので正直そこまでやる必要はないとも思います

ただ、統計学ってどこでも活きると思っていて、それこそお金大好きな人だったら、金融商品の評価とか資産運用のチャート自動予測したりだとか、界隈的に胡散臭い人がたくさんいて信頼できない中、信頼できる情報を自分で作り出すこともできると思ってます。根底として仕組みや理論を学んでいたら、色んな分野で活かせますよねって言いたいだけです!!!

ExoPlayerのSlidingPercentileという帯域ベースのABRを実現するためのクラスがあるんですが、これも帯域のサンプル取って、それらに重み付けして評価してるんです。最初はへ〜としか思わなかったですが、今はパーセンタイルだと!!四分位数だ!!!!とか思うわけですね(ミーハー)

推測をプログラムにやらせる場合とかにも活きそうな気がしてきましたね???統計学偉大wwww

さいごに

お前ほんとに読んでない本を紹介するとか正気じゃねえな!?!?とか思うかもしれませんが、ちゃんと後日書くので安心してください

ちなみに昨今お流行りの機械学習は多分やらないです。今の目的とは別の技術なので

あ、本でもそうですが、実際に分析したり可視化するときにjupyter notebookというOSSインタラクティブなWebアプリを使わされますが、今のとこはGoogle Colabでいいんじゃね???という気持ちになりました。

ここまでクソみたいな文を読んでくださり、ありがとうございます!!!!!謝謝!!!!

こんな本あって、おもしろいよー!とかあったら、教えてくださいー!

それでは皆さん、よい統計学lifeを!!!!!!