注重体验与质量的电子书资源下载网站
分类于: 人工智能 互联网
简介
分类数据分析的统计方法(第2版) 豆 0.0分
资源最后更新于 2020-09-05 22:03:52
作者:[美] 丹尼尔.A.鲍威斯(Daniel A. Powers)
译者:任强 等
出版社:社会科学文献出版社
出版日期:2018-01
ISBN:9787520117210
文件格式: pdf
简介· · · · · ·
本书对分类数据分析的方法和模型,及其在社会科学研究中的应用做了全面介绍。它的一个目标是整合变换方法和潜在变量方法,这是两类不同但又相互补充的处理分类数据分析的传统方法。这也是di一次在一本单册书中详细地介绍针对离散因变量、交叉分类和跟踪数据的模型与方法对于广大的社会科学研究者来说,意义重大,既可以使得他们能顺利使用合适的定类数据的统计方法,又可以让他们对统计后的结果作进一步的科学检验,使得研究能够更加深入下去。
目录
图目录/1
表目录/1
中文版序/1
前 言/1
第1 章 绪论/1
1.1 为什么需要分类数据分析?/1
1.2 分类数据的两种哲学观点/6
1.3 一个发展史的注脚/8
1.4 本书特点/9
第2 章 线性回归模型回顾/11
2.1 回归模型/11
2.2 再谈线性回归模型/17
2.3 分类变量和连续型因变量之间的区别/27
第3 章 二分类数据模型/29
3.1 二分类数据介绍/29
3.2 变换的方法/30
3.3 Logit模型和Probit模型的论证/39
3.4 解释估计值/54
3.5 其他的概率模型/61
3.6 小结/62
第4 章 列联表的对数线性模型/64
4.1 列联表/64
4.2 关联的测量/68
4.3 估计与拟合优度/73
4.4 二维表模型/79
4.5 次序变量模型/89
4.6 多维表的模型/97
第5 章 二分类数据多层模型/110
5.1 导言/110
5.2 聚类二分类数据模型/113
5.3 追踪二分类数据模型/130
5.4 模型估计方法/136
5.5 项目响应模型/151
5.6 小结/159
第6 章 关于事件发生的统计模型/161
6.1 导言/161
6.2 分析转换数据的框架/162
6.3 离散时间方法/163
6.4 连续时间模型/177
6.5 半参数比率模型/188
6.6 小结/211
第7 章 次序因变量模型/213
7.1 导言/213
7.2 赋值方法/214
7.3 分组数据的Logit模型/216
7.4 次序Logit和Probit模型/220
7.5 小结/232
第8 章 名义因变量模型/234
8.1 导言/234
8.2 多项Logit模型/235
8.3 标准多项Logit模型/237
8.4 分组数据的对数线性模型/242
8.5 潜在变量方法/245
8.6 条件Logit模型/246
8.7 设定问题/251
8.8 小结/258
附录A 回归的矩阵方法/259
A.1 导言/259
A.2 矩阵代数/259
附录B 大似然估计/266
B.1 导言/266
B.2 基本原理/266
参考文献/285
索 引/295
译后记/314
图 图1-1 四种测量的分类模式/5
图2-1 关于θ的L对数的大化/19
图2-2 二分类数据的逻辑斯蒂回归与线性回归的比较/27
图3-1 p的logit和probit变换/38
图3-2 以累积概率函数曲线切线的斜率表示的边际效应/57
图3-3 虚拟变量的边际效应/58
图3-4 按家庭收入水平变化的毕业概率/60
图3-5 p的互补双对数变换/61
图5-1 显示预测概率向总比例收缩的观测概率和预测概率/124
图5-2 模型2按照家庭结构和母亲的受教育水平分的婚前生育预测概率/127
图5-3 家庭别随机效应分布/129
图5-4 家庭别随机效应的经验贝叶斯估计值/130
图5-5 观测的、边际的和条件的logit/136
图5-6 β3和σ20的迹线图与直方图/142
图5-7 赋闲比数比的后验分布(南部居住地vs.非南部居住地)(高中毕业vs.未毕业)/147
图5-8 包含3个题项的1PL模型的题项特征曲线/153
图5-9 2PL模型的题项特征曲线/155
图5-10 使用LSAT数据估计的1PL和2PL模型的题项特征曲线/159
图6-1 退学的离散时间风险和生存函数/168
图6-2 对数累积风险和生存函数图/204
图6-3 家庭收入效应的Schoenfeld残差图/207
图6-4 随时间变化的家庭收入效应图/209
图7-1 对应于一个四分类响应变量的累积分布/221
图7-2 潜在变量和现实结果之间的关系/224
表 表2-1 瑞典于默奥市婴儿出生后前6个月的死亡数/24
表2-2 列向布局的数据文件/25
表2-3 对数-比率模型的OLS、FGLS和ML估计值/26
表2-4 回归模型的类型/28
表3-1 按种族、性别和家庭结构分类的高中毕业生/31
表3-2 用虚拟变量以列的形式概括表3-1的数据/32
表3-3 替代的二分类因变量模型估计结果/38
表3-4 按照种族、性别和家庭结构分类的估计毕业概率/39
表3-5 比较主效应和二维交互作用模型/50
表3-6 收入和性别对投票倾向的影响/58
表3-7 个人水平数据的logit和probit模型估计值/59
表4-1 受教育水平和对婚前性行为的态度/65
表4-2 观测(期望)频次/66
表4-3 期望概率/67
表4-4 独立情形下的期望频次/68
表4-5 各单元格对皮尔逊卡方的贡献/68
表4-6 独立情形下的行比例/69
表4-7 观测数据的行比例/69
表4-8 态度例子的完整表格/71
表4-9 基于相邻行和列的局部比数比/72
表4-10 模型A下的皮尔逊卡方构成/74
表4-11 可识别的参数/80
表4-12 Hauser的流动表格/83
表4-13 饱和模型的交互参数:代际流动的例子/83
表4-14 参数μh的估计值/84
表4-15 流动表模型的拟合优度统计量/93
表4-16 对堕胎和婚前性行为的态度/96
表4-17 估计的测度得分/96
表4-18 加州大学伯克利分校的研究生录取数据/98
表4-19 合并后的研究生录取数据/99
表4-20 对录取数据所拟合模型的拟合优度统计量/104
表4-21 模型4的交互参数估计值/105
表4-22 三国阶级流动数据的模型/107
表4-23 国家别的参数/109
表5-1 生物化学领域的博士后训练与NIH资金分布/120
表5-2 常规与随机截距模型/121
表5-3 观测比例()与模型预测的比例()/123
表5-4 初次婚前生育的logit模型/126
表5-5 数值积分的支点(u)和权重(p)/129
表5-6 拟合青年就业数据的追踪模型/135
表5-7 不同方法的估计值/144
表5-8 观测的与期望的响应模式/146
表5-9 logit模型拟合统计量/148
表5-10 Bock和Lieberman法学院能力倾向测试(LSAT)数据/157
表5-11 使用LSAT数据估计的1PL和2PL模型/158
表6-1 事件发生数据/165
表6-2 退学生命表/167
表6-3 人-层(person-level)和人-期(person-period)数据格式/172
表6-4 5次追踪观测到的二分类响应序列/172
表6-5 研究退学的离散时间logit模型估计值/175
表6-6 项目完成之前的等待时间/179
表6-7 表6-6所含数据的发生数-暴露量矩阵/180
表6-8 美国按照年龄、种族和出生结果进行分类的婴儿死亡数(暴露量,以天为单位)
——1995~1998年/185
表6-9 婴儿死亡数据的模型及其拟合统计量/186
表6-10 美国婴儿死亡的基线风险与风险比(1995~1998年)/187
表6-11 事件史数据的概念格式/188
表6-12 分时段事件史数据格式/191
表6-13 表6-12的交互分类数据/192
表6-14 含非比例效应的分段式恒定率模型/192
表6-15 初次婚前生育风险的分段式恒定指数模型/193
表6-16 非比例性诊断检验/206
表6-17 含比例效应与非比例效应的Cox回归模型/208
表7-1 以态度为例的标准分变换/216
表7-2 受教育水平与对婚前性行为的态度/219
表7-3 不同参数求解方法下的次序logit估计值/227
表7-4 次序probit估计值与边际效应/228
表7-5 对妇女就业的态度/229
表7-6 次序logit与单独logit的估计值/230
表7-7 比例比数假定的Brant检验/231
表7-8 部分比例比数模型/231
表8-1 多项logit结果/241
表8-2 三维表情况下多项logit和对数线性模型之间的等价/244
表8-3 按照种族和父亲的受教育年限分的就业状况/244
表8-4 从对数线性模型推出的多项logit估计值/245
表8-5 条件logit模型的估计值/248
表8-6 混合模型的结果/250
表8-7 教育获得/257
表目录/1
中文版序/1
前 言/1
第1 章 绪论/1
1.1 为什么需要分类数据分析?/1
1.2 分类数据的两种哲学观点/6
1.3 一个发展史的注脚/8
1.4 本书特点/9
第2 章 线性回归模型回顾/11
2.1 回归模型/11
2.2 再谈线性回归模型/17
2.3 分类变量和连续型因变量之间的区别/27
第3 章 二分类数据模型/29
3.1 二分类数据介绍/29
3.2 变换的方法/30
3.3 Logit模型和Probit模型的论证/39
3.4 解释估计值/54
3.5 其他的概率模型/61
3.6 小结/62
第4 章 列联表的对数线性模型/64
4.1 列联表/64
4.2 关联的测量/68
4.3 估计与拟合优度/73
4.4 二维表模型/79
4.5 次序变量模型/89
4.6 多维表的模型/97
第5 章 二分类数据多层模型/110
5.1 导言/110
5.2 聚类二分类数据模型/113
5.3 追踪二分类数据模型/130
5.4 模型估计方法/136
5.5 项目响应模型/151
5.6 小结/159
第6 章 关于事件发生的统计模型/161
6.1 导言/161
6.2 分析转换数据的框架/162
6.3 离散时间方法/163
6.4 连续时间模型/177
6.5 半参数比率模型/188
6.6 小结/211
第7 章 次序因变量模型/213
7.1 导言/213
7.2 赋值方法/214
7.3 分组数据的Logit模型/216
7.4 次序Logit和Probit模型/220
7.5 小结/232
第8 章 名义因变量模型/234
8.1 导言/234
8.2 多项Logit模型/235
8.3 标准多项Logit模型/237
8.4 分组数据的对数线性模型/242
8.5 潜在变量方法/245
8.6 条件Logit模型/246
8.7 设定问题/251
8.8 小结/258
附录A 回归的矩阵方法/259
A.1 导言/259
A.2 矩阵代数/259
附录B 大似然估计/266
B.1 导言/266
B.2 基本原理/266
参考文献/285
索 引/295
译后记/314
图 图1-1 四种测量的分类模式/5
图2-1 关于θ的L对数的大化/19
图2-2 二分类数据的逻辑斯蒂回归与线性回归的比较/27
图3-1 p的logit和probit变换/38
图3-2 以累积概率函数曲线切线的斜率表示的边际效应/57
图3-3 虚拟变量的边际效应/58
图3-4 按家庭收入水平变化的毕业概率/60
图3-5 p的互补双对数变换/61
图5-1 显示预测概率向总比例收缩的观测概率和预测概率/124
图5-2 模型2按照家庭结构和母亲的受教育水平分的婚前生育预测概率/127
图5-3 家庭别随机效应分布/129
图5-4 家庭别随机效应的经验贝叶斯估计值/130
图5-5 观测的、边际的和条件的logit/136
图5-6 β3和σ20的迹线图与直方图/142
图5-7 赋闲比数比的后验分布(南部居住地vs.非南部居住地)(高中毕业vs.未毕业)/147
图5-8 包含3个题项的1PL模型的题项特征曲线/153
图5-9 2PL模型的题项特征曲线/155
图5-10 使用LSAT数据估计的1PL和2PL模型的题项特征曲线/159
图6-1 退学的离散时间风险和生存函数/168
图6-2 对数累积风险和生存函数图/204
图6-3 家庭收入效应的Schoenfeld残差图/207
图6-4 随时间变化的家庭收入效应图/209
图7-1 对应于一个四分类响应变量的累积分布/221
图7-2 潜在变量和现实结果之间的关系/224
表 表2-1 瑞典于默奥市婴儿出生后前6个月的死亡数/24
表2-2 列向布局的数据文件/25
表2-3 对数-比率模型的OLS、FGLS和ML估计值/26
表2-4 回归模型的类型/28
表3-1 按种族、性别和家庭结构分类的高中毕业生/31
表3-2 用虚拟变量以列的形式概括表3-1的数据/32
表3-3 替代的二分类因变量模型估计结果/38
表3-4 按照种族、性别和家庭结构分类的估计毕业概率/39
表3-5 比较主效应和二维交互作用模型/50
表3-6 收入和性别对投票倾向的影响/58
表3-7 个人水平数据的logit和probit模型估计值/59
表4-1 受教育水平和对婚前性行为的态度/65
表4-2 观测(期望)频次/66
表4-3 期望概率/67
表4-4 独立情形下的期望频次/68
表4-5 各单元格对皮尔逊卡方的贡献/68
表4-6 独立情形下的行比例/69
表4-7 观测数据的行比例/69
表4-8 态度例子的完整表格/71
表4-9 基于相邻行和列的局部比数比/72
表4-10 模型A下的皮尔逊卡方构成/74
表4-11 可识别的参数/80
表4-12 Hauser的流动表格/83
表4-13 饱和模型的交互参数:代际流动的例子/83
表4-14 参数μh的估计值/84
表4-15 流动表模型的拟合优度统计量/93
表4-16 对堕胎和婚前性行为的态度/96
表4-17 估计的测度得分/96
表4-18 加州大学伯克利分校的研究生录取数据/98
表4-19 合并后的研究生录取数据/99
表4-20 对录取数据所拟合模型的拟合优度统计量/104
表4-21 模型4的交互参数估计值/105
表4-22 三国阶级流动数据的模型/107
表4-23 国家别的参数/109
表5-1 生物化学领域的博士后训练与NIH资金分布/120
表5-2 常规与随机截距模型/121
表5-3 观测比例()与模型预测的比例()/123
表5-4 初次婚前生育的logit模型/126
表5-5 数值积分的支点(u)和权重(p)/129
表5-6 拟合青年就业数据的追踪模型/135
表5-7 不同方法的估计值/144
表5-8 观测的与期望的响应模式/146
表5-9 logit模型拟合统计量/148
表5-10 Bock和Lieberman法学院能力倾向测试(LSAT)数据/157
表5-11 使用LSAT数据估计的1PL和2PL模型/158
表6-1 事件发生数据/165
表6-2 退学生命表/167
表6-3 人-层(person-level)和人-期(person-period)数据格式/172
表6-4 5次追踪观测到的二分类响应序列/172
表6-5 研究退学的离散时间logit模型估计值/175
表6-6 项目完成之前的等待时间/179
表6-7 表6-6所含数据的发生数-暴露量矩阵/180
表6-8 美国按照年龄、种族和出生结果进行分类的婴儿死亡数(暴露量,以天为单位)
——1995~1998年/185
表6-9 婴儿死亡数据的模型及其拟合统计量/186
表6-10 美国婴儿死亡的基线风险与风险比(1995~1998年)/187
表6-11 事件史数据的概念格式/188
表6-12 分时段事件史数据格式/191
表6-13 表6-12的交互分类数据/192
表6-14 含非比例效应的分段式恒定率模型/192
表6-15 初次婚前生育风险的分段式恒定指数模型/193
表6-16 非比例性诊断检验/206
表6-17 含比例效应与非比例效应的Cox回归模型/208
表7-1 以态度为例的标准分变换/216
表7-2 受教育水平与对婚前性行为的态度/219
表7-3 不同参数求解方法下的次序logit估计值/227
表7-4 次序probit估计值与边际效应/228
表7-5 对妇女就业的态度/229
表7-6 次序logit与单独logit的估计值/230
表7-7 比例比数假定的Brant检验/231
表7-8 部分比例比数模型/231
表8-1 多项logit结果/241
表8-2 三维表情况下多项logit和对数线性模型之间的等价/244
表8-3 按照种族和父亲的受教育年限分的就业状况/244
表8-4 从对数线性模型推出的多项logit估计值/245
表8-5 条件logit模型的估计值/248
表8-6 混合模型的结果/250
表8-7 教育获得/257