Jupyter Notebookの設定

新たにインストールする必要が生じたので、ついでに画面の背景色の変更やR言語の使用方法などを備忘録として残しておきます(完全に個人的なメモ)。

  • Anacondaのインストー
  • 背景色やフォントの変更
  • R kernelの設定
続きを読む

Rによるトピックモデル―AKB総選挙2017上位7人のコメントを3つのトピックに分類してみた結果―

Rによるトピックモデルの練習としてとりあえずやってみました。

目次

  • 目次
  • 使用するパッケージ
  • データセット
  • 前処理
    • データの読込み
    • 単語の絞り込み
    • データ構造(class)の変換
  • 分析
    • topicmodelsパッケージによるトピックモデルの推定
    • ldaパッケージによるトピックモデルの推定
    • 推定結果の可視化
    • 結果の解釈
  • おわりに
  • 参考資料
続きを読む

Rによるレコメンドの簡単な例

 岩波データサイエンスVol.5に行列分解を利用したレコメンドについて記事があったので、雰囲気だけでも理解しようと簡単な例を作成してみました。例題として取り扱うのは売れ筋の漫画10タイトルの購入の有無を7人について調査し、7人目が購入していない漫画のうちどの漫画をレコメンドすべきかです。売れ筋漫画についてはジュンク堂書店ランキング(コミックのジュンク堂書店ランキング - hontoベストセラー)の上位10タイトルの漫画(2017年6月18日現在)を利用しました。利用したレコメンドアルゴリズム協調フィルタリング(ユーザベースド、アイテムベースド)、特異値分解(SVD)、非負値行列因子分解(NMF)についてです。また、以下の記事を参考にしてコードを作成しました。

tech-blog.fancs.com

  • 特異値分解(SVD)、非負値行列因子分解(NMF)について

smrmkt.hatenablog.jp

続きを読む

Rによるニューラルネットワーク―neuralnet関数を利用した例―

個人的なメモとしてneuralnet関数の使い方についてまとめてみます。

関数の基本的な使い方については以下の本が詳しいのではないかと思います。

www.shoeisha.co.jp

本記事ではニューラルネットワークを構築して回帰問題に取り組みます。

続きを読む

Rによる階層的クラスタ分析の実践例

クラスター分析の復習の記事では、食品ごとのたんぱく質摂取量のパターンにもとづいて欧州25ヵ国をグルーピングしており、地理的に近い地域の国でクラスタを形成しているならば、日々の食事習慣みも似通ってくるのではないかと推測していました。なので、ここではクラスタ分析の使い方を覚えることを主眼に置きつつ、都道府県の主要な食品の消費データを利用して、地理的に近い県で似通った食品の消費傾向を示すクラスタが形成されるかを検証してみます。

続きを読む

Rによる階層的クラスタ分析の備忘録

教師なし学習の代表的な手法の1つであるクラスタ分析について個人的な論点整理を兼ねてZumel氏とMount氏共著の"Practical Data Science with R"の第8章をまとめてみます(端折ったり本文にないコードを追加したりしてます)。
ちなみに、第8章は以下の出版社サイトからFREEで入手可能です。

Manning | Practical Data Science with R

続きを読む

Rによるコレスポンデンス分析

コレスポンデンス分析(Correspondence Analysis)とは、クロス集計表の表頭項目(列)と表側項目(行)の関係性を視覚的に表現する手法だそうです。クロス集計表を視覚化できるのは便利そうだと思ったのですが、列項目と行項目の両方をプロットした図(同時布置図)の解釈について色々と判断に迷うところがあったので、備忘録を兼ねてまとめておこうと思います。

続きを読む