Skip to content

Instantly share code, notes, and snippets.

ソース


統計学の物語:データから学ぶ教訓集

統計学とは、単なる数式や計算の集まりではありません。それは、データの中に隠された物語を読み解き、世界をより深く理解するための「思考法」なのです。この教訓集では、統計分析、因果推論、そして専門家でさえも惑わす一般的な落とし穴について、現実世界で起きた数十の物語を通して探求していきます。それぞれの物語は、データから学ぶべき重要な教訓を明らかにし、あなたの世界を見るレンズを、より鋭く、より洞察に満ちたものに変えてくれるでしょう。

ソース


ご提供いただいたPDFソース「Active Statistics」内で扱われているストーリーを、授業の学期および週ごとに以下に箇条書きでまとめます。この本は、応用回帰分析と因果推論のための、ストーリー、アクティビティ、問題、デモンストレーションを集めた教材です。

パート2:ストーリー、アクティビティ、問題、デモンストレーション

第15章 一般化線形モデルの概要と応用

ソース: https://users.aalto.fi/~ave/ROS.pdf

エグゼクティブサマリー

本ブリーフィング資料は、書籍『Regression and Other Stories』の第15章で解説されている一般化線形モデル(GLM)の主要な概念を要約するものです。特に、計数データ(カウントデータ)を扱う際のポアソン回帰と負の二項分布回帰の比較に焦点を当てます。

最重要の結論として、ポアソン回帰は「平均と分散が等しい」という厳格な仮定を持つため、実世界のデータで頻繁に見られる過分散(分散が平均を上回る現象)をモデル化できず、適合度が著しく低くなるという重大な欠点を持ちます。これに対し、負の二項分布回帰は分散を調整するための追加パラメータ(φ)を持つことで過分散に柔軟に対応でき、より現実に即した精度の高いモデリングを可能にします。本文書で取り上げる「ゴキブリの駆除実験」の事例では、この違いが明確に示されており、負の二項分布回帰がポアソン回帰よりも優れた適合性を持つことが実証されています。

ソース: https://discourse.datamethods.org/t/the-petty-bone-rct/22077 前半


人工呼吸器ガイドラインの根本的欠陥:COVID-19パンデミックが露呈した「ペティ・ボーンRCT」の問題点

序論:パンデミックで明らかになった医療ガイドラインの脆弱性

COVID-19パンデミックの初期、世界中の集中治療室(ICU)は未曾有の危機に直面した。確立されていたはずの急性呼吸窮迫症候群(ARDS)に対する人工呼吸器ガイドラインは機能的に崩壊し、その科学的妥当性を失い、多くの患者が命を落とした。この悲劇は、単なる新興感染症に対する不測の事態ではなく、集中治療(クリティカルケア)領域の研究手法の設計そのものに起因する、予測された失敗であった。それは、数十年間にわたり根を張ってきた、より根深い構造的欠陥が白日の下に晒された瞬間だったのである。

@genkuroki
genkuroki / 001-056.md
Last active October 29, 2025 10:25
Datamethods ディスカッションフォーラム:Petty/Bone RCT に関する議論 (001-056.md, 051-110.md)

代数学概論:2次・3次方程式の解法とガロア理論の導入

エグゼクティブサマリー

本資料は、代数方程式の解法、特に2次および3次方程式を題材として、ガロア理論の根幹をなす思想を解説するものである。中心的なテーマは、方程式の解が持つ「対称性」を、体の「自己同型写像」という厳密な数学的概念を用いて捉えることにある。

2次方程式の解法において、平方根 $\sqrt{D}$$-\sqrt{D}$ に置き換えても数式全体の構造が保たれる現象は、単なる偶然ではない。これは有理数体 $Q$ を拡大して得られる体 $Q(\sqrt{D})$ 上の自己同型写像の存在を示唆しており、この写像こそがガロア理論における基本的な分析対象となる。

さらに、3次方程式の解法に向けて、 $x^3+y^3+z^3-3xyz$ という対称的な多項式の因数分解が鍵となることが示される。この因数分解には1の原始3乗根 $w$ が不可欠であり、解の構造がより複雑な対称性によって支配されていることを明らかにしている。本資料で提示される演習問題は、これらの抽象的な概念を具体的な計算を通じて理解し、より高次の方程式理論へと進むための基礎を構築することを目的としている。

P値と区間推定の解釈に関するブリーフィング:実践的重要性の観点から

ソース: https://bjsm.bmj.com/content/early/2025/10/05/bjsports-2024-109357

エグゼクティブサマリー

本稿は、医療研究、特にスポーツ医学の分野における統計的指標の一般的な誤解を避け、臨床判断を改善するための新しい解釈フレームワークを提示する。中心的な論点は、P値を「統計的有意性」の二分法的な判定基準として用いる従来のアプローチが、実践的重要性を見過ごし、誤解を招く危険性があるという点である。

この問題に対処するため、本稿ではP値と区間推定を「相性(compatibility)」の観点から解釈することを提唱する。このアプローチでは、P値はデータと特定の仮説(例:効果がないという帰無仮説)との間の一致度を示す連続的な尺度として扱われる。また、信頼区間(CI)は、データと「かなり相性が良い」効果サイズの範囲を示す「相性区間(compatibility interval)」として再解釈される。

医療AIにおける準備性の幻想:フロンティアモデルのストレステストから得られた洞察

エグゼクティブサマリー

GPT-5のような最新のフロンティアモデルは、医療分野のベンチマークでトップスコアを達成しているが、これらのスコアはモデルの真の実用性や準備性を反映しておらず、むしろ「準備性の幻想」を生み出している。本研究で実施された一連の厳格なストレステストは、これらのモデルが深刻な脆弱性を抱えていることを明らかにした。主要なモデルは、画像のような重要な入力情報がなくても正解を推測し、プロンプトの些細な変更で回答を覆し、説得力がありながらも欠陥のある推論を捏造することが頻繁にある。

これらの問題は単なる技術的な不具合ではなく、現在の医療AIベンチマークが、真の医学的理解よりもテスト受験戦略や「ショートカット学習」に報酬を与えているという根本的な欠陥を露呈している。6つの主要モデルと6つの広く使用されているベンチマークを対象とした評価では、高いリーダーボードスコアの裏に、脆弱性、見せかけのパターンへの依存、そして一貫性のない推論能力が隠されていることが判明した。さらに、ベンチマーク自体も、測定する能力(例:視覚的依存度、推論の複雑さ)に大きなばらつきがあるにもかかわらず、同等に扱われていることが示された。