データサイエンティスト【その3:手法】
手法は様々
どれが最適?
データによる。
データサイエンスで解析すべきデータは、必ずしもエクセルに代表されるようなテーブルデータとは限らなかったりする。
(個人的見解)
単語メモ
tabular ≒ structured
regression = 回帰
回帰とはどうやら、データを並べた時にどんな線上に集まっているかを示すことらしい。直線だったり、曲がっていたりする。それを予測するのがデータサイエンス?というのが今のところの理解。
今回の課題
なげぇ~!課題がなげぇ!英語読みたくナイヨ。
こんな一言が。
The data science is what data scientist do.
つまりだ、何でもデータサイエンスの対象になるという考え。
他方、機械学習を行う者、という人がいる。
また、統計学とも少し違う、たまに使うけど、という人もいる。
しかし、そういったカテゴライズはデータサイエンスの敷居を高くしてしまい、一般人への浸透を妨げる要因になる。
データサイエンティストに必要なのは、なんといっても、好奇心。好奇心をもって物事に取り組み、必要なら何でもツールを使う。そしてその事象を楽しそうに語れる。そういったデータサイエンティストが理想像なのだ。
と、課題は言っている気がするのであった。
ちなみに、自分は別にいまさらデータサイエンティストとして大成したいとか、これを皮切りに大企業に抜擢されたいとか、そんな野心を持ち合わしていない。単に好奇心から勉強を始めた。ある意味向いてる?