ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

高校生のためのデータ分析入門 (2):変数ってなに?

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (1):まずは概要を知ろう - ねこすたっと 変数とは 変数のタイプ 量的変数 質的変数 変数の…

高校生のためのデータ分析入門 (1):まずは概要を知ろう

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 データとは データにした段階で情報は失われている データ分析の目的を分類してみる 1. 特徴を発見する 2. 似たグループを探す 3…

ZoteroをWebDAV経由で同期させて資料を管理する

以前、Dropbox経由でZoteroを同期させる方法をまとめました。 necostat.hatenablog.jp この方法だとPDFしか同期できず、Webページやパワポは別の方法で管理しなくてはなりませんでした。 WebDAV(ウェブダブ)経由で同期させる方法だと解決したので、備忘録…

分散分析(ANOVA):球面性仮定

分散分析で満たすべき仮定として球面性の仮定(the assumption of sphericity)*1をよく目にしますが、きちんと勉強したことがなかったので(わかるところだけ)読んでみました。 分散分析に必要な仮定 球面性の仮定とは 2水準間の差の分散に基づいた定義方…

チュートリアル拾い読み (12):Pandas公式チュートリアル (7/7) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyのあとPandasチートシート(PDF)を中心に読んできましたが、今回…

チュートリアル拾い読み (11):Pandas公式チュートリアル (6/7) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyのあとPandasチートシート(PDF)を中心に読んできましたが、そろ…

チュートリアル拾い読み (10):Pandas公式チュートリアル (5/7) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyが終わってPandasに入っています。導入版(Intro to pandas)・簡…

チュートリアル拾い読み (9):Pandas公式チュートリアル (4/7) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyが終わってPandasに入っています。導入版(Intro to pandas)・簡…

チュートリアル拾い読み (8):Pandas公式チュートリアル (3/7) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyが終わってPandasに入っています。導入版(Intro to pandas)・簡…

チュートリアル拾い読み (7):Pandas公式チュートリアル (2/7) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyが終わって前回からはPandasに入っています。導入版(Intro to pan…

チュートリアル拾い読み (6):Pandas公式チュートリアル (1/7) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyが終わって今回からはPandasに入りますが、導入版(Intro to panda…

チュートリアル拾い読み (5):NumPy公式チュートリアル (5/5) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 初回から続くNumPy公式チュートリアルの "NumPy: the absolute basics f…

チュートリアル拾い読み (4):NumPy公式チュートリアル (4/5) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 今回もNumPy公式チュートリアルの "NumPy: the absolute basics for beg…

チュートリアル拾い読み (3):NumPy公式チュートリアル (3/5) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 今回もNumPy公式チュートリアルの "NumPy: the absolute basics for beg…

チュートリアル拾い読み (2):NumPy公式チュートリアル (2/5) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 今回も前回に続き、NumPy公式チュートリアルの "NumPy: the absolute ba…

チュートリアル拾い読み (1):NumPy公式チュートリアル (1/5) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 現時点でのチュートリアル拾い読みのモットーは、 正確さよりも分かりや…

lapply関数とdo.call関数を整理する [R]

do.call( )は関数名と引数のリストを渡して、その関数を呼び出して実行する関数です。 リストに対して一括処理をするとき、たまに登場するんですがイマイチ理解していなかったので整理のためにまとめます。 lapply( )とdo.call( )の違い 関数のオプション引…

ラムダ式を使って関数を定義する [R]

R

同じ操作を反復するときは、map( )やlapply( )を使って関数を一括して適用すると便利です。そしてコードも読みやすくなります。 map( )やlapply( )では、関数を引数にする必要があります。mean( )やsd( )のように、既に与えられている関数だけでなく、自分で…

geom_contour関数で等高線を描く(ggplot2パッケージ)[R]

先日、ある変数の2次元分布をヒートマップを使って可視化する方法をまとめました。 necostat.hatenablog.jp ヒートマップで変数の区切りを細かくしていくと、滑らかなグラデーションにすることができます。 見た目が綺麗になるのはいいんですが、色の差がわ…

rowwise関数を使って複数の列を組み合わせた変数を作成する(tidyverseパッケージ)[R]

臨床現場では、対象者の年齢や症状、検査値などをもとにして計算される「何とかスコア」が使われることがよくあると思います。 臨床研究でも、既に収集された項目からcomposite scoreを計算し、変数に追加したいことはよくあります。 今回はtidyverseパッケ…

across関数を使ってデータフレームの列に対して一括で操作する(tidyverseパッケージ)[R]

以前、データフレームの列(=変数)に対して、追加・名前変更・要約などの操作方法についてまとめました。 necostat.hatenablog.jp necostat.hatenablog.jp 最近は列の操作でacross関数を使うことが多くなってきたので、ここらへんで学び直しておこうと思い…

geom_tileを使って予測確率をヒートマップで表現する(ggplot2パッケージ)[R]

ロジスティック回帰モデルなどから予測されるアウトカム発生確率(=予測確率)をグラフで可視化したいとします。 1つの変数に対して予測確率がどのように変化していくかを示したければ、折れ線グラフにしたり、変数をカテゴリー化して棒グラフで表したりする…

分散分析(ANOVA):固定効果と変量効果

分散分析(Analysis of Variance, ANOVA)を学ぶ目的でKutner先生のApplied Linear Statistical Models(5th edition)を拾い読みし始めました。 前回は二元配置分散分析で分散分析表を作るところまで確認しました。。 necostat.hatenablog.jp 今回は要因の…

分散分析(ANOVA):二元配置分散分析

分散分析(Analysis of Variance, ANOVA)を学ぶ目的でKutner先生のApplied Linear Statistical Models(5th edition)を拾い読みし始めました。 前回は平方和と自由度の分割について、要因が1つの場合を使って確認しました。 necostat.hatenablog.jp 今回は…

分散分析(ANOVA):平方和と自由度の分割

分散分析(Analysis of Variance, ANOVA)を学ぶ目的でKutner先生のApplied Linear Statistical Models(5th edition)を拾い読みし始めました。今回は主に"Chapter 16: Single Factor Studies" から、分散分析の基本となる平方和・自由度の分割についてで…

回帰モデルの結果を限界効果(marginal effect)で示す

前回はロジスティック回帰モデルを(少しだけ)学び直してみました。 necostat.hatenablog.jp ここで扱ったNorton先生の文献では、オッズ比に代わるロジスティック回帰モデルの指標として限界効果(marginal effect)を推奨していましたので、簡単にどんなも…

ロジスティック回帰モデルを学び直す

分かったつもりで使っているけど、よくよく勉強し直したらあんまり分かってなかったことがよくあります。今回はロジスティック回帰モデル(ロジットモデル)について学び直してみました。 読んだ文献は、以下のものです(学び直しと言いながら1本だけです。…

変数の型と測定尺度の分類

データの要約や可視化を説明しようとすると、まずは変数の型を分類しましょうという話になります。 変数の分類に関して扱っている記事は多いですが、これまでPubmed検索可能な論文まで辿ったことがなかったので勉強してみました。 データ型の分類 質的変数の…

混合効果モデルで変化点を探す:Stanを使ったベイズ統計モデリング [R]

以前、segmentedパッケージを使って変化点を探す方法を調べました。 necostat.hatenablog.jp segment( )はglmオブジェクト(=glm関数で当てはめたモデル)とlmeオブジェクト(=変量効果を含む線形回帰モデル)には対応しているんですが、lme( )は変量効果を…

Segmented modelを使って変化点を探す(segmentedパッケージ)[R]

ある点を境にしてアウトカムの変化が急激になっているように見えて、 「変化点はどこなのか」あるいはそもそも「変化点があると言えるのか」を知りたいときがあると思います。 僕もそういうときがあったので少し調べてみました。 使用するパッケージとデータ…