日々のつれづれ

不惑をむかえ戸惑いを隠せない男性の独り言

R

モザイクプロットを活用したクロス集計の可視化

モザイクプロットとは モザイクプロットは、データの分布や変数間の関係性を視覚的に表現するグラフの一種です。データを行と列のセルに分割し、各セルの面積を値の大きさに応じて調整することで、データの全体像を一目で把握できるようになっています。この…

回帰モデルの係数の分散分析のまとめ・その3

R Advent Calender 2023として投稿することにしました 共分散分析で回帰分析の分散分析が出てきたので、少し整理します。 回帰分析を分散分析する目的 回帰分析の分散分析は、データを意思決定に利用するための方法です。 これを使えば、回帰モデルに用いた…

回帰モデルの係数の分散分析のまとめ・その2

R

共分散分析で回帰分析の分散分析が出てきたので、少し整理します。 回帰分析を分散分析する目的 回帰分析の分散分析は、データを意思決定に利用するための方法です。 これを使えば、回帰モデルに用いた異なる要因(説明変数、因子など)が目的変数に与える影…

回帰モデルの係数の分散分析と二元配置分散分析の違い

R

回帰モデルの係数の分散分析は、二元配置分散分析と計算方法が似ているので、分散分析の知識が役に立ちます。ですが、この 2 つは目的や仮定が違っています。注意が必要です。 目的 説明変数 説明変数間、因子間の関係 差の検定 回帰モデルの係数の分散分析 …

平方和のまとめ・その1

R

2 つの要因による効果とその交互作用を検討する統計手法が二元配置分散分析でした。 この方法は、ある値に対して要因 A と要因 B が紐づいたデータあるとき、要因 A の主効果、要因 B の主効果、要因 A と要因 B の交互作用の 3 つの効果を評価します。 二元…

回帰モデルの係数の分散分析のまとめ・その1

R

共分散分析で回帰分析の分散分析が出てきたので、少し整理します。 回帰分析を分散分析する目的 回帰分析の分散分析は、データを意思決定に利用するための方法です。 これを使えば、回帰モデルに用いた異なる要因(説明変数、因子など)が目的変数に与える影…

共分散分析のメモ・その1

R

交互作用が見つかる場合、二元配置分散分析をして、ad-hoc 解析をしてきました。そのため、共分散分析(ANCOVA)の必要性は高くなく、使う機会に恵まれなかった。 とはいえ、使わないから知らなくて良い、ってこともないので、まとめることにしました。 共分…

分散分析のメモ・その3

R

分散分析と F 検定の関係が分からなくなることが多いのでメモ 二元配置分散分析(Two-Way ANOVA) 分散分析は、3 つ以上の群の平均値に差があるかどうかを評価する統計手法で、異なる条件や処理が平均値に与える影響を評価できる。な お、二元配置分散分析は…

分散分析のメモ・その2

R

分散分析と F 検定の関係が分からなくなることが多いのでメモ 一元配置分散分析 分散分析は、3 つ以上の群の平均値に差があるかどうかを評価する統計手法で、異なる条件や処理が平均値に与える影響を評価できる。な お、一元配置分散分析は、要因数が 1 種類…

分散分析のメモ・その1

R

分散分析と F 検定の関係が分からなくなることが多いのでメモ 一元配置分散分析 分散分析は、3 つ以上の群の平均値に差があるかどうかを評価する統計手法で、異なる条件や処理が平均値に与える影響を評価できる。な お、一元配置分散分析は、要因数が 1 種類…

LARSの整理・その3

R

LASSOをまとめていると、LARS(最小角回帰法:Least Angle Regression)が出てきたので、これを機会に手順をちゃんと理解しようと思う。 行列と角度、高校や大学で習ったものの、いざ実データで、となるとどうしてもピンと来ない。実装してようやく理解でき…

LASSO回帰の復習・その4

R

LASSO回帰を実装する Rのmtcarsを使った実装例を作った。 回帰係数(w)と正則化パラメータ($\lambda$)の初期値は適当に決めている。 回帰係数の初期値 ゼロベクトルや小さなランダムノイズを含んだベクトルなどがある。 ゼロベクトル: 回帰係数をすべてゼ…

LASSO回帰の復習・その3

R

Lasso回帰の最適化アルゴリズム 最適化アルゴリズムは座標降下法が有名ですが、調べてみると他にもいくつかありました。 分かる範囲でリストアップしてみた。 それぞれの理解をまとめておく。 名称 特徴 メリット デメリット 座標降下法 1変数ずつ重みの更新…

LARSの整理・その2

R

LASSOをまとめていると、LARS(最小角回帰法:Least Angle Regression)が出てきたので、これを機会に手順をちゃんと理解しようと思う。 行列と角度、高校や大学で習ったものの、いざ実データで、となるとどうしてもピンと来ない。実装してようやく理解でき…

LARSの整理・その1

R

LASSOをまとめていると、LARS(最小角回帰法:Least Angle Regression)が出てきたので、これを機会に手順をちゃんと理解しようと思う。 行列と角度、高校や大学で習ったものの、いざ実データで、となるとどうしてもピンと来ない。実装してようやく理解でき…

最尤推定の復習・その1

R

最尤推定法の復習 最尤推定法は、データに確率モデルを当てはめるときに必要になるパラメータを、データから推定する方法です。 私の場合、大学の教養課程で習ったものの在学中に使う機会はなく、就職してからも使う機会なく時間が流れ、40歳を目前としたこ…

LASSO回帰の復習・その2

R

Lasso回帰と他の回帰の比較表 Lasso回帰は比較的新しい方法で、L1正則化を行うRidge回帰は少し古く、L1正則化とL2正則化を組み合わせるElastic NetはLasso回帰より後の年代です。 この2つに最小二乗法を加えた2種とLasso回帰を比較します。 最小二乗法 利点:…

LASSO回帰の復習・その1

R

Lasso(Least Absolute Shrinkage and Selection Operator)回帰とは Lasso回帰は、統計モデルの予測精度を向上させるための回帰分析手法の一種で、機械学習や統計学の分野で広く利用されています。最初の報告は地球物理学で行われましたが、後にRobert Tibs…

回帰や分類に使えるデータセットの一覧

R

毎回、使うときに探すのも大変だし、使い慣れたものばかりだと正しくコードを書いたのか分かりにくい。 2023年時点の記録を残そうとおもった。 回帰や分類の問題に使えそうなデータセット Rにあるもの 種類 名前 説明 ライブラリ 回帰 mtcars 自動車の性能に…

ロジスティック回帰モデルの復習・その3

R

次に、例題を作って、手順を理解してみる。 5教科の成績から入学試験の合否を予測する 5教科の成績から入学試験の合否を予測するロジスティック回帰モデルを考えてみる。 ここでは、5教科の成績を入力変数、入学試験の合否を出力変数にして、ロジスティック…

データを理解する・その3「特異値分解、固有値」

これも、2020年にまとめていた記事。これが最後 放置していたままも嫌なので、公開します。 ここから 長い年末休暇を利用して、理解した記録です。 特異値分解 特異値分解は、行列を 3 つの行列の積に分解する。 $$ X = USV^{T} $$ このとき、$U$を右得意行…

ロジスティック回帰モデルの復習・その2

R

何となくで使ってきたロジスティック回帰モデルを勉強しなおした。 ロジスティック回帰モデルの作成の流れはざっとこんな感じだろう。 入力変数$x$にロジット関数を適用してロジット値を計算する。このとき、ロジット関数は多項式で、この多項式の係数$w$と…

データを理解する・その2「共分散」

これも、2020年にまとめていた記事。 放置していたままも嫌なので、公開します。 ここから 長い年末休暇を利用して、理解した記録です。 データのばらつきを理解する とはいえ、ちゃんとした教育を受けていないので、この辺の理解があいまいです。 2021年時…

データを理解する・その1「偏差、分散、標準偏差」

2020年に書いて放置していたのですが、このままにするのも嫌なので、公開します。 ここから 長い年末休暇を利用して、理解した記録です。 データのばらつきを理解する とはいえ、ちゃんとした教育を受けていないので、この辺の理解があいまいです。 2021年時…

ロジスティック回帰のまとめ・その1

R

何となくで使ってきたロジスティック回帰モデルを勉強しなおした。 ロジスティック回帰モデルとは ざっくり言うと、ある出来事が「起こる」、「起こらない」ことを予測する方法で、また、起こる/起こらないは、二値分類でも多クラス分類にも使える。 この確…

予測モデルの整理

趣味や自習も含めて、いままで使ってきた予測モデルを整理する ロジスティック回帰モデル: テストの成績などの説明変数から大学の合否などの目的変数を予測するモデル。線形分離可能な境界線を作成し、各説明変数の重みを調整することで予測する。確率を推定…

TokyoRでLTした

公開せずに下書きに残っていたので、 TokyoRのLT ライフログとしてLTを記録。 ライフログ tokyor.connpass.com 発表者 タイトル 資料 LT1: @bob3bob3 Tokyo.Rも100回目なので、そろそろPythonと仲良くしたい。 LT2: @kazutan Rに管理されてみる LT3: @eitsup…

パッケージの終わり

R

rgdalパッケージのメンテナンスが終わる Provides bindings to the 'Geospatial' Data Abstraction Library ('GDAL') (>= 1.11.4) and access to projection/transformation operations from the 'PROJ' library. Please note that 'rgdal' will be retired …

RでGISデータを処理する

R

Tokyo.R #107がジオデータ特集をすると聞いて、GDALを思い出そう思ったのと、折角だし、sfパッケージも勉強して、rgdalとの対比をLTしようともくろんだ。 でも、ちょっと気が変わったので、その準備だけ残しておくことにした。 次回、第107回 #TokyoR は2023…

TokyoRでLTした

第105回のTokyoRでなぜかZoom共有できず、第106回に再エントリした。 これまでを振り返る 十数年ぶりにR勉強会に参加し始めて、ウェブで数回プレゼンしてきた コロナ禍、プレゼンする機会が減った、 何か続けないと鈍る、という理由で、3年前からTokyoRに再…