【SQL】ブラウザ上でちょっとしたクエリを実行して結果を確認したいときに便利なサイト

SQLの勉強のときに、テキストに記載されているクエリを簡単にブラウザ上で試してみたいときに以下のサイトがよさげだったので、忘れないように記録を残しておく。 sqlfiddle.comこのサイトでは画面が左右で分割されており、左側でテーブルの作成(CREATE TAB…

【メモ】Windows環境でGPU版TensorFlowを利用するための環境構築

WindowsでtensorflowのGPU版を利用するための環境構築のメモを以下のとおり残しておく。 Windows環境におけるTensorFlowのGPU版はCUDA, cuDNNのバージョン依存があるので注意が必要。

【Python】多腕バンディット問題①―ε-greedyアルゴリズムのPythonコードの詳細メモ

ディスプレイ広告を出稿するにあたり、広告のレイアウト案1と案2をどちらにすべきかであったり、ウェブページのレイアウトをA案とB案のどちらにするかなどの意思決定の場面に遭遇する機会が仕事でありました。 前者では決裁関与者による手直しにより案1に…

【式展開】2値分類問題における交差エントロピー誤差関数及びパラメータに対する勾配の導出について

『詳解ディープラーニング』(PP.88-91)を読んだので、復習を兼ねて該当ページの式展開をより詳細に記載してみました。

【式展開】シグモイド関数自身でその1階の微分を表現できることについて

シグモイド関数(sigmoid function) を微分すると、 として表現できるのがこの関数の特徴だそうです。以下ではこのような式になるのか確認してみます。

【学習メモ】 単純パーセプトロンのpythonコードの一部

そろそろ深層学習の手法も勉強してみたいと思い『詳解ディープラーニング』を少しずつ読んでいます。 この本で分からなかったことやメモを残しておきたいことなどを個人的な学習メモとして残しておきます。なお、上記の書籍のコードは著者が以下で公開してい…

【Java】Commons-Math3.xライブラリによる単回帰分析のコードの紹介

javaによる単回帰分析の簡単なコードをメモ代わりに残しておきます。単回帰なので目的変数と説明変数の共分散を説明変数の分散で割り算すればいいだけであり、わざわざライブラリを使用するほどではないですが、せっかくなのでApache Commonsの Commons-Math…

【Kaggle入門, R言語】Titanic号の乗客データを用いた生存者予測―ロジスティックモデルでスコア80%を超えることができるか挑戦してみた―

Kaggleに入門してみたので,その内容をまとめてみます. 基本的にはKernelsで優秀な参加者のコードを参考に所々アレンジしているといった内容の記事になります.Kaggleでは入門者向けにタイタニック号の乗客データを用いた生存者予測を行うためのデータセッ…

【メモ】Jupyter Notebookの設定

新たにインストールする必要が生じたので、ついでに画面の背景色の変更やR言語の使用方法などを備忘録として残しておきます(完全に個人的なメモ)。 Anacondaのインストール 背景色やフォントの変更 R kernelの設定

Rによるトピックモデル―AKB総選挙2017上位7人のコメントを3つのトピックに分類してみた結果―

Rによるトピックモデルの練習としてとりあえずやってみました。 目次 目次 使用するパッケージ データセット 前処理 データの読込み 単語の絞り込み データ構造(class)の変換 分析 topicmodelsパッケージによるトピックモデルの推定 ldaパッケージによるト…

【R言語】友達に漫画をおススメするときに利用するレコメンドアルゴリズムについて

岩波データサイエンスVol.5に行列分解を利用したレコメンドについて記事があったので、雰囲気だけでも理解しようと簡単な例を作成してみました。売れ筋の漫画10タイトルの購入の有無を7人について調査し、ある人(小林さん)がまだ購入してない漫画のうち、ど…

Rによるニューラルネットワーク―neuralnet関数を利用した例―

個人的なメモとしてneuralnet関数の使い方についてまとめてみます。関数の基本的な使い方については以下の本が詳しいのではないかと思います。www.shoeisha.co.jp本記事ではニューラルネットワークを構築して回帰問題に取り組みます。

【R言語】政府統計を用いた階層的クラスタリングの実践例

クラスター分析の復習の記事では、食品ごとのたんぱく質摂取量のパターンにもとづいて欧州25ヵ国をグルーピングしており、地理的に近い地域の国でクラスタを形成しているならば、日々の食事習慣みも似通ってくるのではないかと推測していました。なので、こ…

【R言語】階層的クラスタリング結果の可視化及び客観的なクラスタ数の決定方法について

教師なし学習の代表的な手法の1つであるクラスタ分析について個人的な論点整理を兼ねてZumel氏とMount氏共著の"Practical Data Science with R"の第8章をまとめてみます(端折ったり本文にないコードを追加したりしてます)。 ちなみに、第8章は以下の出版社…

【R言語】プロ野球データを例にして試みるコレスポンデンス分析の解釈の仕方ーデータ収集から視覚化までー

コレスポンデンス分析(Correspondence Analysis)とは、クロス集計表の表頭項目(列)と表側項目(行)の関係性を視覚的に表現する手法だそうです。クロス集計表を視覚化できるのは便利そうだと思ったのですが、列項目と行項目の両方をプロットした図(同時…

【因子分析, R言語, スクレイピング】プロ野球選手の打撃成績を「長打力」「打撃技術」「走力」に要約すると上位の選手は誰になるのか!?

因子分析の練習としてどのような分析を行おうかと考えていたところ、以下のブログに面白そうな記事を発見しました。nijyester.blog.fc2.com nijyester.blog.fc2.com この記事では過去10年間におけるパリーグの打者(規定打席到達に限る)の打撃成績から「長…

【R言語, データサイエンスにもとづく経営戦略】財務データから企業が戦略的に利益をどの程度調整したかを示す尺度の算出方法

実証会計学という財務(管理)会計学やファイナンス、応用ミクロ経済学などの様々な研究領域の知見を援用した学際的な研究分野があります。 その中には、発生主義会計によって生じる会計発生高(accruals)に着目して企業の利益マネジメント行動(earnings ma…

Rによる簡単な組合せシミュレーション

以下の組合せの確率をシミュレーションで求めてみたいです。 R小学校の6年1組は遠足で京都に行くことになりました。クラスの総数は30人であり、そこからくじ引き(無作為)に5人選んで6つの班を作ります。Aくんが同じクラスのBさんと同じ班になる確率はいく…

アート・オブ・Rプログラミング 応用例5.2.5を{dplyr}パッケージを使用して書き換えてみた

『アート・オブ・Rプログラミング』の5.2.5「応用例:給与調査」(PP.105-107)ではデータクリーニング時に必要となるコードを記載しているのですが、近年{dplyr}や{stringr}など前処理に役立つパッケージがデファクトスタンダートになっているように思われ…