logo
分类于: 计算机基础 人工智能 职场办公

简介

新一代人工智能与语音识别

新一代人工智能与语音识别 0.0分

资源最后更新于 2020-03-29 02:00:36

作者:马延周

出版社:出版社清华大学出版社

出版日期:2019-07

ISBN:9787302523840

文件格式: pdf

标签: 教材 人工智能 工具书 语言学

简介· · · · · ·

有关俄语语音识别的研究在中国尚处于起步阶段,此技术在中俄两国的民间交流和军事交往中发挥着重要作用。本书充分利用了新一代人工智能技术的研究成果,介绍了基于新闻语料的俄语连续语音识别技术。本书的目标是建立基于Kaldi环境设计并实现的俄语连续语音识别原型系统,使其同时具备在线识别功能和离线识别功能,以验证声学模型和语言模型的优化算法的有效性,进而为面向特定领域的俄语语音识别实用系统的研发提供理论方法、实验数据和关键技术支撑。为了实现上述目标,本书详细介绍了俄语语音语料的采集、加工、处理,俄语文本语料的采集、清洗、过滤,俄语发音词典的自动预测、生成,声学模型建模基本单元(音素集)的确定,声学模型和语言模型的优化。本书可作为高等院校外国语言学及应用语言学专业、电子信息和通信类专业本科生及研究生的教学参考书,也可供语音信息处理与应用开发等领域的研究人员使用。

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

  1. 内容简介
  2. 前言
  3. 第0章 绪论
  4. 0.1 研究依据
  5. 0.2 研究对象与研究目标
  6. 0.3 研究方法
  7. 0.4 研究意义
  8. 0.5 本书的创新点
  9. 0.6 语料来源
  10. 0.7 本书的结构
  11. 第1章 语音识别技术研究综述
  12. 1.1 语音识别的定义与分类
  13. 1.1.1 语音识别的定义
  14. 1.1.2 语音识别的分类
  15. 1.2 语音识别技术的研究进展
  16. 1.2.1 语音识别技术的发展概况
  17. 1.2.2 国外俄语语音识别技术的研究进展
  18. 1.2.3 中国俄语语音识别技术的研究进展
  19. 1.3 语音识别系统的基本原理
  20. 1.3.1 特征提取
  21. 1.3.2 声学模型
  22. 1.3.3 语言模型
  23. 1.3.4 解码
  24. 1.4 语音识别技术研究所关注的关键问题
  25. 本章小结
  26. 第2章 语音数据的加工处理
  27. 2.1 问题描述
  28. 2.2 众包的定义及内涵
  29. 2.2.1 众包的基本概念
  30. 2.2.2 众包的基本流程
  31. 2.2.3 众包的关键问题
  32. 2.3 解决方案
  33. 2.3.1 质量控制
  34. 2.3.2 语音标注平台的架构
  35. 2.3.3 标注平台的设计与实现
  36. 2.4 语音标注
  37. 2.4.1 语音有效性判断
  38. 2.4.2 语音转写规范
  39. 2.4.3 语音标注规范
  40. 2.5 实验设计与结果分析
  41. 2.5.1 实验设计
  42. 2.5.2 结果分析
  43. 2.5.3 结论
  44. 本章小结
  45. 第3章 俄语声学模型的建立
  46. 3.1 连续语音识别
  47. 3.1.1 连续语音识别的整体模型
  48. 3.1.2 声学模型训练的HMM-GMM方法
  49. 3.1.3 声学模型训练中的HMM-DNN方法
  50. 3.2 俄语语音学概述
  51. 3.2.1 俄语的使用及分布情况
  52. 3.2.2 俄语语音的基本特点
  53. 3.2.3 俄语音素的发音特征
  54. 3.2.4 俄语元音音素的随位变化
  55. 3.2.5 俄语辅音音素的随位变化
  56. 3.3 俄语声学单元的选择
  57. 3.3.1 俄语SAMPA音素集
  58. 3.3.2 俄语音系表
  59. 3.4 实验设计与结果分析
  60. 3.4.1 实验设计
  61. 3.4.2 结果分析
  62. 本章小结
  63. 第4章 俄语语言模型的建立
  64. 4.1 文本语料的准备与清洗
  65. 4.1.1 数据来源的筛选
  66. 4.1.2 数据爬取
  67. 4.1.3 数据的去重与清洗
  68. 4.1.4 格式化处理
  69. 4.2 语言模型简述
  70. 4.2.1 语言模型的平滑技术
  71. 4.2.2 语言模型的剪枝算法
  72. 4.3 语言模型的训练流程
  73. 4.3.1 语言模型的训练实现
  74. 4.3.2 词典的选择
  75. 4.3.3 LM的剪枝与优化
  76. 4.4 实验结果分析
  77. 4.4.1 词典规模测试
  78. 4.4.2 语料规模测试
  79. 4.4.3 语言模型剪枝测试
  80. 本章小结
  81. 第5章 基于Kaldi的俄语语音识别原型系统
  82. 5.1 系统设计的目标与原则
  83. 5.1.1 系统设计的目标
  84. 5.1.2 系统设计的原则
  85. 5.2 系统的开发环境与整体架构
  86. 5.2.1 系统的开发环境
  87. 5.2.2 系统的整体架构
  88. 5.3 Kaldi环境的搭建
  89. 5.3.1 Kaldi及实验环境
  90. 5.3.2 Kaldi训练服务器的搭建
  91. 5.3.3 AM训练数据及参数设置
  92. 5.3.4 LM训练数据及参数设置
  93. 5.4 Kaldi训练优化
  94. 5.4.1 Kaldi声学建模
  95. 5.4.2 GPU加速
  96. 5.5 语音识别原型系统的设计
  97. 5.5.1 系统GUI的设计
  98. 5.5.2 在线识别功能
  99. 5.5.3 离线识别功能
  100. 5.6 实验设计与结果分析
  101. 5.6.1 实验设计
  102. 5.6.2 实验结果
  103. 5.6.3 结果分析
  104. 本章小结
  105. 第6章 总结与展望
  106. 6.1 本书的主要成果
  107. 6.2 未来的研究计划
  108. 附录A 英汉术语对照表
  109. 附录B 其他相关资料
  110. B.1 俄语发音词典(76277个词形)示例
  111. B.2 俄语解码词表(189971个词形)示例
  112. B.3 俄语字符Unicode编码对照表
  113. B.4 俄语语音格式化程序(转换为16KB、16b)
  114. B.5 俄语文本转Unicode编码程序
  115. B.6 从https://twitter.com网站上下载的部分网页文件(json格式)示例
  116. B.7 从http://www.interfax.ru网站上下载的部分网页文件(json格式)示例
  117. B.8 俄语拉丁字母转写表
  118. 参考文献