目的 以下の本を購入したので、環境構築を行うことにした。 www.oreilly.co.jp ただし、環境については、本書には記載されていないMicrosoft WindowsのWindows Subsystem for Linux( WSL ) 上で構築する。 結果的にはData Science Toolboxにログインできたが…
Windows機でPostgreSQLを利用して、テーブルを定義したSQL文が書かれたテキストファイルを読み込み、そのテーブルにcsvファイルからデータをインポートする流れをまとめた。 環境(簡易)は以下のとおり。OS: Windows 10 64bit PostgreSQL10.3
SQLの勉強のときに、テキストに記載されているクエリを簡単にブラウザ上で試してみたいときに以下のサイトがよさげだったので、忘れないように記録を残しておく。 sqlfiddle.comこのサイトでは画面が左右で分割されており、左側でテーブルの作成(CREATE TAB…
WindowsでtensorflowのGPU版を利用するための環境構築のメモを以下のとおり残しておく。 Windows環境におけるTensorFlowのGPU版はCUDA, cuDNNのバージョン依存があるので注意が必要。
ディスプレイ広告を出稿するにあたり、広告のレイアウト案1と案2をどちらにすべきかであったり、ウェブページのレイアウトをA案とB案のどちらにするかなどの意思決定の場面に遭遇する機会が仕事でありました。 前者では決裁関与者による手直しにより案1に…
『詳解ディープラーニング』(PP.88-91)を読んだので、復習を兼ねて該当ページの式展開をより詳細に記載してみました。
シグモイド関数(sigmoid function) を微分すると、 として表現できるのがこの関数の特徴だそうです。以下ではこのような式になるのか確認してみます。
そろそろ深層学習の手法も勉強してみたいと思い『詳解ディープラーニング』を少しずつ読んでいます。 この本で分からなかったことやメモを残しておきたいことなどを個人的な学習メモとして残しておきます。なお、上記の書籍のコードは著者が以下で公開してい…
javaによる単回帰分析の簡単なコードをメモ代わりに残しておきます。単回帰なので目的変数と説明変数の共分散を説明変数の分散で割り算すればいいだけであり、わざわざライブラリを使用するほどではないですが、せっかくなのでApache Commonsの Commons-Math…
Kaggleに入門してみたので,その内容をまとめてみます. 基本的にはKernelsで優秀な参加者のコードを参考に所々アレンジしているといった内容の記事になります.Kaggleでは入門者向けにタイタニック号の乗客データを用いた生存者予測を行うためのデータセッ…
新たにインストールする必要が生じたので、ついでに画面の背景色の変更やR言語の使用方法などを備忘録として残しておきます(完全に個人的なメモ)。 Anacondaのインストール 背景色やフォントの変更 R kernelの設定
岩波データサイエンスVol.5に行列分解を利用したレコメンドについて記事があったので、雰囲気だけでも理解しようと簡単な例を作成してみました。売れ筋の漫画10タイトルの購入の有無を7人について調査し、ある人(小林さん)がまだ購入してない漫画のうち、ど…
個人的なメモとしてneuralnet関数の使い方についてまとめてみます。関数の基本的な使い方については以下の本が詳しいのではないかと思います。www.shoeisha.co.jp本記事ではニューラルネットワークを構築して回帰問題に取り組みます。
クラスター分析の復習の記事では、食品ごとのたんぱく質摂取量のパターンにもとづいて欧州25ヵ国をグルーピングしており、地理的に近い地域の国でクラスタを形成しているならば、日々の食事習慣みも似通ってくるのではないかと推測していました。なので、こ…
教師なし学習の代表的な手法の1つであるクラスタ分析について個人的な論点整理を兼ねてZumel氏とMount氏共著の"Practical Data Science with R"の第8章をまとめてみます(端折ったり本文にないコードを追加したりしてます)。 ちなみに、第8章は以下の出版社…
コレスポンデンス分析(Correspondence Analysis)とは、クロス集計表の表頭項目(列)と表側項目(行)の関係性を視覚的に表現する手法だそうです。クロス集計表を視覚化できるのは便利そうだと思ったのですが、列項目と行項目の両方をプロットした図(同時…
因子分析の練習としてどのような分析を行おうかと考えていたところ、以下のブログに面白そうな記事を発見しました。nijyester.blog.fc2.com nijyester.blog.fc2.com この記事では過去10年間におけるパリーグの打者(規定打席到達に限る)の打撃成績から「長…
以下の組合せの確率をシミュレーションで求めてみたいです。 R小学校の6年1組は遠足で京都に行くことになりました。クラスの総数は30人であり、そこからくじ引き(無作為)に5人選んで6つの班を作ります。Aくんが同じクラスのBさんと同じ班になる確率はいく…
『アート・オブ・Rプログラミング』の5.2.5「応用例:給与調査」(PP.105-107)ではデータクリーニング時に必要となるコードを記載しているのですが、近年{dplyr}や{stringr}など前処理に役立つパッケージがデファクトスタンダートになっているように思われ…