def 小児科医():

かけだし小児科医が仕事の合間にプログラミングを勉強するブログです。

機械学習

機械学習の評価指標を学ぶ

統計検定も落ち着いたので、ぼちぼち機械学習の勉強も再開したい。 回帰問題の評価指標 RMSE:Root Mean Squared Error RMSLE:Root Mean Squared Logarithmic Error MAE:Mean Absolute Error 二値分類の評価指標(正例である確率が予測値の場合) logloss(cross…

統計検定2級の勉強をする話(12)

前回↓ defpediatric.hatenablog.com 今回は線形モデル分析 今までなんとなーくわかったようなわかってないようなつもりでやっていたので、復習。 defpediatric.hatenablog.com こういう時に過去の記事を見るとなんとも言えない気持ちになる。 線形回帰モデル…

第1回Kaggle反省会

" data-en-clipboard="true"> " data-en-clipboard="true"> " data-en-clipboard="true">前回 defpediatric.hatenablog.com はじめに やってみたこと 結果… 1位の解法:Less is more 前処理 モデル 学んだこと 感想 はじめに そんなこんなでとりあえずものは…

畳み込みニューラルネットワークの話

以前ディープラーニングを勉強してみたことがあったのだが、もうほとんど覚えていない。 defpediatric.hatenablog.com この本も深層学習の分野に入った。 畳み込みニューラルネットワーク(convolutional neural network;CNN) 畳み込み プーリング CIFAR10で…

機械学習をやってみる話

前回 defpediatric.hatenablog.com 第2章は「機械学習」 前回の顧客データを使って機械学習を行う。 機械学習には、 クラスタリング:同じような特徴ベクトルに分類すること 分類:すでに分類されているものを分析して、新たな対象がどの分類に属するか予想…

dtreevizに手こずった話。

機械学習で決定木の可視化をしたくて、dtreevizを使おうとしたら全然できなくて困った話。 やりたかったこと from dtreeviz.trees import dtreeviz# 決定木を描画viz = dtreeviz(clf, data_e, data_o, target_name='Class', feature_names=time_index, class…

ディープラーニングに挑戦してみる話②

前回の続き defpediatric.hatenablog.com 手書き数字の画像を認識するAI作り。 DNNの仕組みはわかったけど重みづけはどうするのって話。 ・損失関数 それには損失関数が最小になる重みを決定する。 一般的なのはクロスエントロピーの誤差 正解ラベルをt、出…

ディープラーニングに挑戦してみる話。

「人工知能プログラミングのための数学がわかる本」もついに最終章 最後は深層学習に挑戦。 手書きの数字を認識するモデルを作る。 今回は基本的(らしい)deep neural network;DNNを使うとのこと。 データセットは「MNIST」というものを使う。 なんか手書きの…

ロジスティック回帰の話。

前回の続き。 defpediatric.hatenablog.com ロジスティック回帰 ロジスティック回帰は"回帰"なのにやってることは分類??? そもそも"回帰"は予測値が連続値で、"分類"は予測値が離散値。 コードで書いてしまうと一瞬。 from sklearn.linear_model import L…

自然言語処理の勉強をしてみる話。

前回結構苦労してMeCabをインストールした後の話。 defpediatric.hatenablog.com 自然言語処理を行うにあたって、文章を品詞分解する必要がある。 例を挙げると コンビニの糖質〜%off商品は脂質が多いことがあるからダイエット時には注意 コンビニ/の/糖質/…

MeCab(とhomebrew)を使うのにめっちゃ苦労した話。

えー本日は前回の続き。 「人工知能プログラミングのための数学がわかる本」の自然言語処理のところをやっていく。 今回は自然言語処理ということで青空文庫のtxtデータを使って、文学作品の作者を当てるというもの。 まずは文章の形態素解析(要は単語分割)…

消滅しかけてたデータで線形回帰モデルを作る話。

前回、機械学習の勉強をしようと思ったが本が古かったのでデータセットが消滅していた。 でもググったらなんとかなった。という話をした。 defpediatric.hatenablog.comんで、その時紹介した本↓ この本での機械学習のところで、BostonHousingデータセットを…

医療AI人材養成コース【インテンシブ】というものに入った話。

実は4月から東北大学医療AI人材養成コースのインテンシブコースを受講することにした。 仕事をしながらオンデマンドで医療AIの勉強ができるというもの。(大学院にしっかり入学するやつももちろんある。) あと北大と岡山大学でやってるらしい。 90分くらいの…

Boston Housing データセットが消滅した、という話。

自分は少し(だいぶ)ADHD傾向なので、いろんなことに注意がいってしまう。 プログラミングにおいてもそうで、まだ何も自信を持ってできることはないのに、python以外の言語もやってみたいと思っているし、機械学習もやってみたいし、そのための数学とかも勉強…