2017-06-11から1日間の記事一覧

Rによるニューラルネットワーク―neuralnet関数を利用した例―

個人的なメモとしてneuralnet関数の使い方についてまとめてみます。関数の基本的な使い方については以下の本が詳しいのではないかと思います。www.shoeisha.co.jp本記事ではニューラルネットワークを構築して回帰問題に取り組みます。

【R言語】政府統計を用いた階層的クラスタリングの実践例

クラスター分析の復習の記事では、食品ごとのたんぱく質摂取量のパターンにもとづいて欧州25ヵ国をグルーピングしており、地理的に近い地域の国でクラスタを形成しているならば、日々の食事習慣みも似通ってくるのではないかと推測していました。なので、こ…

【R言語】階層的クラスタリング結果の可視化及び客観的なクラスタ数の決定方法について

教師なし学習の代表的な手法の1つであるクラスタ分析について個人的な論点整理を兼ねてZumel氏とMount氏共著の"Practical Data Science with R"の第8章をまとめてみます(端折ったり本文にないコードを追加したりしてます)。 ちなみに、第8章は以下の出版社…

【R言語】プロ野球データを例にして試みるコレスポンデンス分析の解釈の仕方ーデータ収集から視覚化までー

コレスポンデンス分析(Correspondence Analysis)とは、クロス集計表の表頭項目(列)と表側項目(行)の関係性を視覚的に表現する手法だそうです。クロス集計表を視覚化できるのは便利そうだと思ったのですが、列項目と行項目の両方をプロットした図(同時…

【因子分析, R言語, スクレイピング】プロ野球選手の打撃成績を「長打力」「打撃技術」「走力」に要約すると上位の選手は誰になるのか!?

因子分析の練習としてどのような分析を行おうかと考えていたところ、以下のブログに面白そうな記事を発見しました。nijyester.blog.fc2.com nijyester.blog.fc2.com この記事では過去10年間におけるパリーグの打者(規定打席到達に限る)の打撃成績から「長…

【R言語, データサイエンスにもとづく経営戦略】財務データから企業が戦略的に利益をどの程度調整したかを示す尺度の算出方法

実証会計学という財務(管理)会計学やファイナンス、応用ミクロ経済学などの様々な研究領域の知見を援用した学際的な研究分野があります。 その中には、発生主義会計によって生じる会計発生高(accruals)に着目して企業の利益マネジメント行動(earnings ma…

Rによる簡単な組合せシミュレーション

以下の組合せの確率をシミュレーションで求めてみたいです。 R小学校の6年1組は遠足で京都に行くことになりました。クラスの総数は30人であり、そこからくじ引き(無作為)に5人選んで6つの班を作ります。Aくんが同じクラスのBさんと同じ班になる確率はいく…

アート・オブ・Rプログラミング 応用例5.2.5を{dplyr}パッケージを使用して書き換えてみた

『アート・オブ・Rプログラミング』の5.2.5「応用例:給与調査」(PP.105-107)ではデータクリーニング時に必要となるコードを記載しているのですが、近年{dplyr}や{stringr}など前処理に役立つパッケージがデファクトスタンダートになっているように思われ…