データサイエンス

データサイエンス

ドミニオンのデータを集め、機械学習モデルを作って分析してみた

サプライの情報を入力にして『何ターンでゲームが終わるか』を予測する機械学習モデルを作れるか に挑戦しました.
データサイエンス

シンプルなのに高性能!推薦モデル Easer の紹介

今回は「Embarrassingly Shallow Autoencoders for Sparse Data」 という論文で提案されていた Easer と呼ばれる推薦モデルについてまとめたいと思います。このモデルはひじょ〜〜〜にシンプルなのにも関わらず、多くのデータセットで高い性能を発揮したすごいやつです。
データサイエンス

機械学習でも使える!?Python便利ライブラリ bidict

今回は機械学習の用途などでとても便利なPythonライブラリである、bidictを紹介したいと思います! bidictは要素に双方向なアクセスが可能な、dictの拡張クラスの実装です。
データサイエンス

データサイエンスの部署に配属された新卒の頃の僕に伝えたいこと

今回の記事では、データサイエンスに関わる部署に配属された新卒時代の僕に向けて、伝えたいことをまとめました。 非常にポエミーな内容になってしまいましたが、ここに書かれている内容が少しでも誰かの役に立てば幸いです。
データサイエンス

[書評]ビッグデータ分析のシステムと開発がしっかりわかる教科書 を読んだ

今回は ビッグデータ分析のシステムと開発がしっかりわかる教科書 を読んだので、それについて見所や感想などをまとめたいと思います。
データサイエンス

[書評]Applied Data Science Using PySpark を読んだ

今回は Applied Data Science Using PySpark: Learn the End-to-End Predictive Model-Building Cycle を読んだので、それについて見所や感想などをまとめたいと思います。