科目一覧へ戻る | 2023/03/17 現在 |
科目名/Subject | 数理統計学/Mathematical Statistics |
---|---|
担当教員(所属)/Instructor | 西山 茂 (商学研究科) |
授業科目区分/Category | 昼間コース 学科別専門科目 |
開講学期/Semester | 2016年度/Academic Year 後期/Fall Semester |
開講曜限/Class period | 火/Tue 3 |
対象所属/Eligible Faculty | 商学部/Faculty of Commerce |
配当年次/Years | 2年 , 3年 , 4年 |
単位数/Credits | 2 |
研究室番号/Office | 西山 茂(1号館‐418) |
オフィスアワー/Office hours |
西山 茂(火曜日15時から17時まで。授業終了後に申し出るか、事前にメールで連絡すること。 nisiyama@res.otaru-uc.ac.jp) |
更新日/Date of renewal | 2016/02/24 | ||
---|---|---|---|
授業の目的・方法 /Course Objectives and method |
統計学の基礎的な数理を学ぶ。内容としては、色々な確率分布、無作為サンプル(=データと呼ばれる)から計算する平均値など主たる統計量が従う標本分布、区間推定と仮説検定及び標準誤差、検出力などの基礎概念の理解が目標となる。 統計学の教育方法・学習方法は、近年長足の進歩を遂げつつある統計分析ソフトウェアを誰でも容易にフリーで利用できるようになったことが背景となり、大学という場でも大きく変化しつつある。本授業では、理論的に分かっている多くの定理をとりあげるが、このような理論的な結果を理解する方法には二つある。一つは伝統的な方法ともいえるもので、数理的な結果は数学というツールを用いて理解するという方法である。もう一つは、最近急速に普及している方法であり、統計分析ソフトウェア(R、SAS、SPSSが特に優勢である)を活用してサンプリングなど必要な数値実験を行い、実験結果が理論と合致していることを確認する方法である。本授業では、基本的には数学を用いて説明を進めることにするが、併せて統計分析ソフト「R」を利用して実験を授業中に行い、数学によって発見され証明された重要な結果が現実に当てはまることを確認する予定である。但し、統計分析ソフトの使用は理解の補助が目的であり、入力すべきスクリプトは資料で配布するが、実際にコンピューターで作業をするのは各自の自習にゆだねる予定である(実習室でのコンピューター実習は行わない)。 |
||
達成目標 /Course Goals |
本授業が最終的に目指す目標は以下の二項目である。 1.社会で広く活用されているデータ解析や計量経済分析の数理的な基礎を理解する。 2.データに含まれている情報を効率的に引き出すということの意味、非効率なデータ解析の意味合いを正しく理解する。 具体的には、以下の事項を段階別に習得することが達成目標である。 使用テキストの第2章「確率分布」については以下の事項である: 1.データを要約して得られるヒストグラム(度数分布)と理論モデルである確率分布の意味の違い、使い方の違いを理解する。 2.データから計算される平均値とそのデータに当てはまっているはずの確立分布の平均値(=期待値)の違い、違って当然という理由について理解する。 3.2と同じことを分散や標準偏差についても理解する。 4.「確率変数」という用語を理解する。期待値や分散がもつ基本的性質を示す公式を利用して必要な計算ができる。 5.二値分布、正規分布など基本となる確率分布についてその使い方、適用するべき場合を理解する。特に正規分布の利用に際しては「標準値(ないし基準値)」の使い方を習得する。 6.確率変数の色々な関数の分布を導く方法を習得する。 使用テキストの第3章「標本分布」については以下の事項である: 1.データを一つの無作為サンプルとして解釈する見方を理解する。 2.無作為サンプルから算出される平均値や分散などの「統計量」は確率的に決まってくる、一定の標本分布に従うという考え方を理解する。 3.サンプルから計算する標本平均が従う標本分布はどんな分布であるか、何故そうなるかを理解する。 4.サンプルから計算する分散(標準偏差ではない)についてもその標本分布がどうなるかを理解する。 5.3,4を通じて、正規分布を用いる場合、カイ二乗分布が役立つ場合があること、色々な確率分布が発見されてきたことの意義を理解する。 6.統計的推測で多用される「T値」と上記「標準値」の違いについて理解した上で、T値は「T分布」に従うことを理解する。併せて、自由度の概念、T分布の利用に際して自由度が関係することを学ぶ。 使用テキストの第4章「統計的推測」については以下の事項である: 1.良い推定とはどんな推定であるかを理解する。 2.良い検定とはどんな検定であるかを理解する。 3.「標準誤差」の意味する内容を理解する。 4.推定については信頼係数と区間推定を習得する。 5.検定については「有意」という用語の意味を理解する。 6.有意水準、第1種の過誤、第2種の過誤、検出力という用語の意味を理解する。 7.二標本問題とはどのような問題であるかを理解する。併せて、既知の情報の違いによって、色々な検定方法に分かれることを理解する。 |
||
授業内容 /Course contents |
授業は以下の順で進める予定である。但し、理解度の浸透などに応じて若干のずれが発生する可能性がある。 第1回: オリエンテーション、統計的なものの見方と分布の特徴 第2回: 確率的な考え方と確率分布。データの平均と期待値の違い。 第3回: 確率分布の分散。期待値と分散に関する基本公式。 第4回: 離散型分布と連続型分布。二値分布、正規分布。 第5回: 正規分布、標準値、シグマ区間。 第6回: 小テスト(1)。無作為サンプルの統計量と標本分布。合計値を確率的に予測する。 第7回: 標本平均の標本分布。ルートNの法則。中心極限定理。 第8回: 色々な母集団から得られるサンプルの平均値を確率的に予測する。 第9回: データの分散ではなぜいけないか。不偏分散の利用目的。 第10回: データの分散が従う標本分布とカイ二乗分布の関係。 第11回: 小テスト(2)。推定と誤差。点推定と区間推定。 第12回: 標準誤差と誤差の見積もり。信頼係数。 第13回: 検定と判断ミス。第1種の過誤と第2種の過誤。 第14回: 有意とは何か。有意水準、検出力の評価。 第15回: 二標本問題と正規検定、T検定。 上の小テスト(1)、(2)は、使用テキストの第2章、第3章終了時に行うもので理解度のチェックが目的である。 |
||
使用教材 /Teaching materials |
西山茂『基礎の徹底 統計学』(エコノミスト社)を使用する。 授業範囲は第2章「確率分布」、第3章「標本分布」、第4章「統計的推測」であるが、第1章「データの分布」については第1回授業で簡単に復習する(データの平均値、分散と標準偏差程度は学習経験があることを前提する)。テキスト第5章「変量間の関係」は範囲外とする。 |
||
成績評価の方法 /Grading |
定期試験(60%)及び平常点(40%=2回×20%)を総合評価する。平常点の中に授業中の練習問題やクイズに対する回答などを含めることがある。また宿題を出すことがあるが、内容が伴ったレポートを提出期限までに全て提出した場合、平常点を加算する。 | ||
成績評価の基準 /Grading Criteria |
最小限の到達度目標は、データの合計値・平均値が従う標本分布を理解し、標準誤差と有意性を理解できているか否かである。この点を単位認定の基準とする。その他、経済学科の基準に従う。 | ||
履修上の注意事項 /Remarks |
授業中に統計分析ソフト「R]を操作することがある。「R」をインストール済みのPCを持参すると、自ら入力し、統計的な要点についてその場で理解を深めることができる(と思われる)。 | ||
備考 /Notes |
「R」はフリーであり、本学実習室内のPCでも利用できる。「R」の入手については以下のサイト(CRAN)を参照のこと。 https://cran.r-project.org/ |
||
遠隔授業 /Online class |
|