数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (1):まずは概要を知ろう - ねこすたっと 変数とは 変数のタイプ 量的変数 質的変数 変数の…
数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 データとは データにした段階で情報は失われている データ分析の目的を分類してみる 1. 特徴を発見する 2. 似たグループを探す 3…
以前、Dropbox経由でZoteroを同期させる方法をまとめました。 necostat.hatenablog.jp この方法だとPDFしか同期できず、Webページやパワポは別の方法で管理しなくてはなりませんでした。 WebDAV(ウェブダブ)経由で同期させる方法だと解決したので、備忘録…
分散分析で満たすべき仮定として球面性の仮定(the assumption of sphericity)*1をよく目にしますが、きちんと勉強したことがなかったので(わかるところだけ)読んでみました。 分散分析に必要な仮定 球面性の仮定とは 2水準間の差の分散に基づいた定義方…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyのあとPandasチートシート(PDF)を中心に読んできましたが、今回…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyのあとPandasチートシート(PDF)を中心に読んできましたが、そろ…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyが終わってPandasに入っています。導入版(Intro to pandas)・簡…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyが終わってPandasに入っています。導入版(Intro to pandas)・簡…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyが終わってPandasに入っています。導入版(Intro to pandas)・簡…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyが終わって前回からはPandasに入っています。導入版(Intro to pan…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyが終わって今回からはPandasに入りますが、導入版(Intro to panda…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 初回から続くNumPy公式チュートリアルの "NumPy: the absolute basics f…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 今回もNumPy公式チュートリアルの "NumPy: the absolute basics for beg…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 今回もNumPy公式チュートリアルの "NumPy: the absolute basics for beg…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 今回も前回に続き、NumPy公式チュートリアルの "NumPy: the absolute ba…
Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 現時点でのチュートリアル拾い読みのモットーは、 正確さよりも分かりや…
do.call( )は関数名と引数のリストを渡して、その関数を呼び出して実行する関数です。 リストに対して一括処理をするとき、たまに登場するんですがイマイチ理解していなかったので整理のためにまとめます。 lapply( )とdo.call( )の違い 関数のオプション引…
同じ操作を反復するときは、map( )やlapply( )を使って関数を一括して適用すると便利です。そしてコードも読みやすくなります。 map( )やlapply( )では、関数を引数にする必要があります。mean( )やsd( )のように、既に与えられている関数だけでなく、自分で…
先日、ある変数の2次元分布をヒートマップを使って可視化する方法をまとめました。 necostat.hatenablog.jp ヒートマップで変数の区切りを細かくしていくと、滑らかなグラデーションにすることができます。 見た目が綺麗になるのはいいんですが、色の差がわ…
臨床現場では、対象者の年齢や症状、検査値などをもとにして計算される「何とかスコア」が使われることがよくあると思います。 臨床研究でも、既に収集された項目からcomposite scoreを計算し、変数に追加したいことはよくあります。 今回はtidyverseパッケ…
以前、データフレームの列(=変数)に対して、追加・名前変更・要約などの操作方法についてまとめました。 necostat.hatenablog.jp necostat.hatenablog.jp 最近は列の操作でacross関数を使うことが多くなってきたので、ここらへんで学び直しておこうと思い…
ロジスティック回帰モデルなどから予測されるアウトカム発生確率(=予測確率)をグラフで可視化したいとします。 1つの変数に対して予測確率がどのように変化していくかを示したければ、折れ線グラフにしたり、変数をカテゴリー化して棒グラフで表したりする…
分散分析(Analysis of Variance, ANOVA)を学ぶ目的でKutner先生のApplied Linear Statistical Models(5th edition)を拾い読みし始めました。 前回は二元配置分散分析で分散分析表を作るところまで確認しました。。 necostat.hatenablog.jp 今回は要因の…
分散分析(Analysis of Variance, ANOVA)を学ぶ目的でKutner先生のApplied Linear Statistical Models(5th edition)を拾い読みし始めました。 前回は平方和と自由度の分割について、要因が1つの場合を使って確認しました。 necostat.hatenablog.jp 今回は…
分散分析(Analysis of Variance, ANOVA)を学ぶ目的でKutner先生のApplied Linear Statistical Models(5th edition)を拾い読みし始めました。今回は主に"Chapter 16: Single Factor Studies" から、分散分析の基本となる平方和・自由度の分割についてで…
前回はロジスティック回帰モデルを(少しだけ)学び直してみました。 necostat.hatenablog.jp ここで扱ったNorton先生の文献では、オッズ比に代わるロジスティック回帰モデルの指標として限界効果(marginal effect)を推奨していましたので、簡単にどんなも…
分かったつもりで使っているけど、よくよく勉強し直したらあんまり分かってなかったことがよくあります。今回はロジスティック回帰モデル(ロジットモデル)について学び直してみました。 読んだ文献は、以下のものです(学び直しと言いながら1本だけです。…
データの要約や可視化を説明しようとすると、まずは変数の型を分類しましょうという話になります。 変数の分類に関して扱っている記事は多いですが、これまでPubmed検索可能な論文まで辿ったことがなかったので勉強してみました。 データ型の分類 質的変数の…
以前、segmentedパッケージを使って変化点を探す方法を調べました。 necostat.hatenablog.jp segment( )はglmオブジェクト(=glm関数で当てはめたモデル)とlmeオブジェクト(=変量効果を含む線形回帰モデル)には対応しているんですが、lme( )は変量効果を…
ある点を境にしてアウトカムの変化が急激になっているように見えて、 「変化点はどこなのか」あるいはそもそも「変化点があると言えるのか」を知りたいときがあると思います。 僕もそういうときがあったので少し調べてみました。 使用するパッケージとデータ…