PR曲線とROC曲線を理解する(後編)

こんばんは 今回は、3週間ほど前に書いた「PR曲線とROC曲線を理解する(前編)」という記事の続編です。 ontheblink.hatenablog.com 前回はPR曲線・ROC曲線について理解するために欠かせない混同行列や、適合率・再現率といった指標について、その意味と共に…

【ブログ紹介】機械学習・データサイエンティスト初心者向けのブログ

こんばんは 今回はブログの紹介記事です。機械学習・データサイエンティスト系のブログって最近増えているんですが、その中でもmyフォロワー(@takahashinbun)のお気に入りのブログを1つ紹介したいと思います。 ブログ紹介 machine-learning-stock-predictio…

【CBT方式】統計検定2級合格!おすすめ統計書籍の紹介

こんばんは 3月1日に統計検定2級に合格しましたので、今回はおすすめ書籍の紹介などをメインにしていきたいと思います。 対象読者はデータサイエンティストを目指す人向けに書いてますが、統計を勉強したいなら書籍はオススメなので参考にしてみてください!…

PR曲線とROC曲線を理解する(前編)

こんばんは 今回の記事は、2クラス分類タスクの際にしばしば登場するPR曲線とROC曲線について理解することを目的とします。機械学習を学ぶ上で最初に重要になるのは、結果をしっかりと評価出来るようになることだと思います。 前編ではPR曲線・ROC曲線を理解…

【Pandas】初見データ確認の心得と使えるメソッド!

こんばんは 今日の記事は初見データの確認について。データを扱う以上、どんな分析を行うにも最初はまずデータを眺めることになると思います。 Pandasを使ってcsvファイルやpickleファイルやなんやらからデータフレームに読み込んだはいいものの、初手どうす…

正則化の意味を理解する

「過学習」に陥らないようにモデルを構築することは、機械学習(教師有り学習)の基本です。正則化は過学習を防ぐテクニックの一つです。Weight Decayとも呼ばれ、DeepLearningなど最新の手法でも使われています。 正則化は難しい概念ではないので、実際に使…

データサイエンティストへの道

どこぞの無名新米データサイエンティストに興味を持つ人はいないと思うので、初投稿では明瞭簡潔にこのブログの趣旨を書こうと思います。 当ブログで扱う内容は、 機械学習・ディープラーニングの理論と実践 Python・R等のプログラミング言語と関連ライブラ…