Boston Housing データセットが消滅した、という話。
自分は少し(だいぶ)ADHD傾向なので、いろんなことに注意がいってしまう。
プログラミングにおいてもそうで、まだ何も自信を持ってできることはないのに、python以外の言語もやってみたいと思っているし、機械学習もやってみたいし、そのための数学とかも勉強したい。
僕がエンジニアで、仕事でプログラミングをやらないといけない場合は器用貧乏になるのは目に見えているのでやらないが、趣味なのでやる。
というわけで東京大学卒、絶賛プログラマー中の友人に高校3年生で数学が止まっている僕におすすめの本を聞いた。
でおすすめ頂いたのがこれ。「人工知能プログラミングのための数学がわかる本」
確かに初心者に優しく、高校時代の数学を復習することができた。
この本、最後の方に機械学習をやってみよう!的な部分がある。
この本に限らずpythonの機械学習系の本は、だいたい初めの方にscikit-learnのデータセットを使いことが多く、導入として"Boston Housing データセット"が使われる(ような気がする)
だがしかし、最新のscikit-learnでは倫理的な理由(犯罪数とかのデータがあるからかな?)で廃止されてしまったのだ。
一応代わりにカルフォルニアの同じようなデータはあるのだが、本の解説に沿って進める、あるいは答え合わせする、というのができない。。。
しかしあきらめずにGoogle先生に頼ってみると、フツーにGitHubにデータが配布されていた。
…解決。
最近機械学習の勉強を始めた人は要注意です。