2023-07-01から1ヶ月間の記事一覧
最尤推定法の復習 最尤推定法は、データに確率モデルを当てはめるときに必要になるパラメータを、データから推定する方法です。 私の場合、大学の教養課程で習ったものの在学中に使う機会はなく、就職してからも使う機会なく時間が流れ、40歳を目前としたこ…
Lasso回帰と他の回帰の比較表 Lasso回帰は比較的新しい方法で、L1正則化を行うRidge回帰は少し古く、L1正則化とL2正則化を組み合わせるElastic NetはLasso回帰より後の年代です。 この2つに最小二乗法を加えた2種とLasso回帰を比較します。 最小二乗法 利点:…
Lasso(Least Absolute Shrinkage and Selection Operator)回帰とは Lasso回帰は、統計モデルの予測精度を向上させるための回帰分析手法の一種で、機械学習や統計学の分野で広く利用されています。最初の報告は地球物理学で行われましたが、後にRobert Tibs…
毎回、使うときに探すのも大変だし、使い慣れたものばかりだと正しくコードを書いたのか分かりにくい。 2023年時点の記録を残そうとおもった。 回帰や分類の問題に使えそうなデータセット Rにあるもの 種類 名前 説明 ライブラリ 回帰 mtcars 自動車の性能に…
次に、例題を作って、手順を理解してみる。 5教科の成績から入学試験の合否を予測する 5教科の成績から入学試験の合否を予測するロジスティック回帰モデルを考えてみる。 ここでは、5教科の成績を入力変数、入学試験の合否を出力変数にして、ロジスティック…
これも、2020年にまとめていた記事。これが最後 放置していたままも嫌なので、公開します。 ここから 長い年末休暇を利用して、理解した記録です。 特異値分解 特異値分解は、行列を 3 つの行列の積に分解する。 $$ X = USV^{T} $$ このとき、$U$を右得意行…
何となくで使ってきたロジスティック回帰モデルを勉強しなおした。 ロジスティック回帰モデルの作成の流れはざっとこんな感じだろう。 入力変数$x$にロジット関数を適用してロジット値を計算する。このとき、ロジット関数は多項式で、この多項式の係数$w$と…
これも、2020年にまとめていた記事。 放置していたままも嫌なので、公開します。 ここから 長い年末休暇を利用して、理解した記録です。 データのばらつきを理解する とはいえ、ちゃんとした教育を受けていないので、この辺の理解があいまいです。 2021年時…
2020年に書いて放置していたのですが、このままにするのも嫌なので、公開します。 ここから 長い年末休暇を利用して、理解した記録です。 データのばらつきを理解する とはいえ、ちゃんとした教育を受けていないので、この辺の理解があいまいです。 2021年時…
何となくで使ってきたロジスティック回帰モデルを勉強しなおした。 ロジスティック回帰モデルとは ざっくり言うと、ある出来事が「起こる」、「起こらない」ことを予測する方法で、また、起こる/起こらないは、二値分類でも多クラス分類にも使える。 この確…
趣味や自習も含めて、いままで使ってきた予測モデルを整理する ロジスティック回帰モデル: テストの成績などの説明変数から大学の合否などの目的変数を予測するモデル。線形分離可能な境界線を作成し、各説明変数の重みを調整することで予測する。確率を推定…
公開せずに下書きに残っていたので、 TokyoRのLT ライフログとしてLTを記録。 ライフログ tokyor.connpass.com 発表者 タイトル 資料 LT1: @bob3bob3 Tokyo.Rも100回目なので、そろそろPythonと仲良くしたい。 LT2: @kazutan Rに管理されてみる LT3: @eitsup…
ToktoRでジオデータという話をきっかけに、rgdalのメンテナンス終了を知った訳ですが、 席に空きがでそうな雰囲気だったので、調べた経緯をプレゼンにしていた。 結局、枠が埋まったようで、良かった。 前回のことがあったので、私は無理に参加せず、プレゼ…
rgdalパッケージのメンテナンスが終わる Provides bindings to the 'Geospatial' Data Abstraction Library ('GDAL') (>= 1.11.4) and access to projection/transformation operations from the 'PROJ' library. Please note that 'rgdal' will be retired …