日々のつれづれ

不惑をむかえ戸惑いを隠せない男性の独り言

Python

モザイクプロットを活用したクロス集計の可視化

モザイクプロットとは モザイクプロットは、データの分布や変数間の関係性を視覚的に表現するグラフの一種です。データを行と列のセルに分割し、各セルの面積を値の大きさに応じて調整することで、データの全体像を一目で把握できるようになっています。この…

データを理解する・その3「特異値分解、固有値」

これも、2020年にまとめていた記事。これが最後 放置していたままも嫌なので、公開します。 ここから 長い年末休暇を利用して、理解した記録です。 特異値分解 特異値分解は、行列を 3 つの行列の積に分解する。 $$ X = USV^{T} $$ このとき、$U$を右得意行…

データを理解する・その2「共分散」

これも、2020年にまとめていた記事。 放置していたままも嫌なので、公開します。 ここから 長い年末休暇を利用して、理解した記録です。 データのばらつきを理解する とはいえ、ちゃんとした教育を受けていないので、この辺の理解があいまいです。 2021年時…

データを理解する・その1「偏差、分散、標準偏差」

2020年に書いて放置していたのですが、このままにするのも嫌なので、公開します。 ここから 長い年末休暇を利用して、理解した記録です。 データのばらつきを理解する とはいえ、ちゃんとした教育を受けていないので、この辺の理解があいまいです。 2021年時…

予測モデルの整理

趣味や自習も含めて、いままで使ってきた予測モデルを整理する ロジスティック回帰モデル: テストの成績などの説明変数から大学の合否などの目的変数を予測するモデル。線形分離可能な境界線を作成し、各説明変数の重みを調整することで予測する。確率を推定…

SVMの多項式カーネルとガウスカーネル

ChatGPTの練習でSVMのカーネルを調べたので記録しておく ChatGPTの回答はコードや説明文は誰かの著作権に抵触する可能性がある 調べものとして利用価値は高いが、回答をまるまる転用せず、自分の言葉、コードで残すことが肝要です カーネルとは サポートベク…

tSNEをまとめた

R ライブラリの tSNE を比べる 作者の van der Maaten 氏が公式 HP で tSNE をまとめている 。 R は複数の tSNE を持つ 。それぞれ異なるので、各々を比較する。 一覧 ライブラリ 関数名 CRAN リンク ソースコード tsne tsne link source Rtsne Rtsne link s…

コマンドプロンプトでProxyを設定してダウンロードする

ある日を境にWebからデータを取れなくなってた。 放置していたけど、面倒になってきたので、ちゃんと設定した。 管理者権限でproxy設定して、ユーザーでIDとパスワードを 設定すれば良い、って話だった。 proxyの設定を確認する ブラウザが使えるってことは…

Check.IO 2日目

Check.IO の2日目 前回は「文章に含まれている数字だけの単語をカウントする」ってことで、勉強サイトの1問目にしては難しいな、ってことでした。 2日目はどんな感じかというと Even the Last You are given an array of integers. You should find the sum …

Check.IO 1日目

Check.IO の一日目 これから少しずつ進めていくのですが、今のスキルでどこまで進むのか、とても楽しみです。 (といいながら、blogを下書きで放置していたので、初めてから7か月16日目らしい。) まずは1日目。 Sum Number In a given text you need to sum t…

Python の勉強でCheck.IOを始めた

Pythonの勉強どうなってる? Python、切羽詰まった動機付けもなく、だらだらと勉強している。 いまだに初学者を抜け出せず、中級者の手前で足踏みしている感覚が抜けない。 だめだ… 戦う相手がいないと燃えないタイプなんだよね… と思ってネットサーフィンし…

Pythonで行列処理2

1か月ぶりの更新ですね Pythonでの行列はNumpyライブラリで大方のことはできるようだ。手持ちのデータだと内積を使う機会が多いかな。 自分が相手をするデータで処理方法が決まるし、慣れていない処理はどうしでもコードが思いつかない。 仕方ないとはいえ、…

Pythonで行列処理

かなり日にちが開いてしまいました まわりの環境の変化がある季節だと思う ということで、Pythonも少し離れていた Rでお馴染みの行列処理、Pythonでもストレスなくできる はじめてRを触ったとき、行列処理が快適でPerlやRubyにない魅力を感じた そのころの感…

Pythonで文字列処理

Pythonの文字列処理はRよりもPerlやRubyに近い感じ Rは統計環境なので文字列が弱くても仕方ないって思います 数値処理をR、文字列処理をPerlやRubyって使い分けた方が効率が良くなるんですね。 そう考えると、数値も文字列も処理できるPythonは便利な気がし…

Pythonで数値処理1 四捨五入、対数、指数、三角関数

四捨五入でnp.fixはRで使ったことがない機能 年齢データから年代をとるときに使えそう import numpy as np #NumPyライブラリの読み込み 四捨五入 a = [1.0,1.2,1.4,1.5,1.8,2.0,2,2.4] np.round(a) #四捨五入 array([ 1., 1., 1., 2., 2., 2., 2., 2.]) np.t…

Pythonで四則演算

まえのメモを参考にPythonコードをmarkdownで描いてみた import numpy as np #NumPyライブラリの読み込み 四則演算 1+1 #足し算 2 1-1 #引き算 0 2*3 #掛け算 6 30/4 #割り算 7.5 商、あまり、べき乗 30//4 #商 小数点以下を切り捨て 7 30.0//4 #小数点以下…

Pythonことはじめ

Jupyter Notebookが高機能すぎて驚いてる IE上でコード書いて、走らせて、数式はLatexの表記を使える もう、「すごい」か言葉が出てこない で、本題 プログラムの書籍でよくある「Hello World!!」ってやつ コンソールに入力が出るのはうれしいかもしれない …