データサイエンティスト【その3:手法】

手法は様々

どれが最適?

データによる。

データサイエンスで解析すべきデータは、必ずしもエクセルに代表されるようなテーブルデータとは限らなかったりする。

(個人的見解)

単語メモ

tabular ≒ structured

regression = 回帰

回帰とはどうやら、データを並べた時にどんな線上に集まっているかを示すことらしい。直線だったり、曲がっていたりする。それを予測するのがデータサイエンス?というのが今のところの理解。

今回の課題

なげぇ~!課題がなげぇ!英語読みたくナイヨ。

こんな一言が。

The data science is what data scientist do.

つまりだ、何でもデータサイエンスの対象になるという考え。

他方、機械学習を行う者、という人がいる。

また、統計学とも少し違う、たまに使うけど、という人もいる。

しかし、そういったカテゴライズはデータサイエンスの敷居を高くしてしまい、一般人への浸透を妨げる要因になる。

データサイエンティストに必要なのは、なんといっても、好奇心。好奇心をもって物事に取り組み、必要なら何でもツールを使う。そしてその事象を楽しそうに語れる。そういったデータサイエンティストが理想像なのだ。

と、課題は言っている気がするのであった。

ちなみに、自分は別にいまさらデータサイエンティストとして大成したいとか、これを皮切りに大企業に抜擢されたいとか、そんな野心を持ち合わしていない。単に好奇心から勉強を始めた。ある意味向いてる?