logo
分类于: 编程语言 计算机基础

简介

Java自然语言处理

Java自然语言处理 0.0分

资源最后更新于 2020-03-29 01:25:45

作者:〔美〕理查德M.里斯

译者:邹伟孙逢举

出版社:出版社机械工业出版社

出版日期:2018-03

ISBN:9787111592112

文件格式: pdf

标签: 计算机 编程 Java 智能系统与技术丛书

简介· · · · · ·

自然语言处理(NLP)已用于解决各种各样的问题,包括对搜索引擎的支持,对网页文本的总结与分类,以及结合机器学习技术解决诸如语音识别、查询分析等问题。它已经在任何包含有用信息的文件中使用。理查德M.里斯(Richard M.Reese),曾就职于学术界和工业界。他曾在电信和航天工业领域工作17年,期间曾担任研发、软件开发、监督和培训等多个职位。他目前任教于塔尔顿州立大学,运用他多年来积累的行业经验来完善他的课程。

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

  1. 译者序
  2. 作者简介
  3. 审校者简介
  4. 前言
  5. 第1章 NLP简介
  6. 1.1 什么是NLP
  7. 1.2 为何使用NLP
  8. 1.3 NLP的难点
  9. 1.4 NLP工具汇总
  10. 1.4.1 Apache OpenNLP
  11. 1.4.2 Stanford NLP
  12. 1.4.3 LingPipe
  13. 1.4.4 GATE
  14. 1.4.5 UIMA
  15. 1.5 文本处理概览
  16. 1.5.1 文本分词
  17. 1.5.2 文本断句
  18. 1.5.3 人物识别
  19. 1.5.4 词性判断
  20. 1.5.5 文本分类
  21. 1.5.6 关系提取
  22. 1.5.7 方法组合
  23. 1.6 理解NLP模型
  24. 1.6.1 明确目标
  25. 1.6.2 选择模型
  26. 1.6.3 构建、训练模型
  27. 1.6.4 验证模型
  28. 1.6.5 使用模型
  29. 1.7 准备数据
  30. 1.8 本章小结
  31. 第2章 文本分词
  32. 2.1 理解文本分词
  33. 2.2 什么是分词
  34. 2.3 一些简单的Java分词器
  35. 2.3.1 使用Scanner类
  36. 2.3.2 使用split方法
  37. 2.3.3 使用BreakIterator类
  38. 2.3.4 使用StreamTokenizer类
  39. 2.3.5 使用StringTokenizer类
  40. 2.3.6 使用Java核心分词法的性能考虑
  41. 2.4 NLP分词器的API
  42. 2.4.1 使用OpenNLPTokenizer类分词器
  43. 2.4.2 使用Stanford分词器
  44. 2.4.3 训练分词器进行文本分词
  45. 2.4.4 分词器的比较
  46. 2.5 理解标准化处理
  47. 2.5.1 转换为小写字母
  48. 2.5.2 去除停用词
  49. 2.5.3 词干化
  50. 2.5.4 词形还原
  51. 2.5.5 使用流水线进行标准化处理
  52. 2.6 本章小结
  53. 第3章 文本断句
  54. 3.1 SBD方法
  55. 3.2 SBD难在何处
  56. 3.3 理解LingPipe的HeuristicSentenceModel类的SBD规则
  57. 3.4 简单的Java SBD
  58. 3.4.1 使用正则表达式
  59. 3.4.2 使用BreakIterator类
  60. 3.5 使用NLP API
  61. 3.5.1 使用OpenNLP
  62. 3.5.2 使用Stanford API
  63. 3.5.3 使用LingPipe
  64. 3.6 训练文本断句模型
  65. 3.6.1 使用训练好的模型
  66. 3.6.2 使用SentenceDetectorEvaluator类评估模型
  67. 3.7 本章小结
  68. 第4章 人物识别
  69. 4.1 NER难在何处
  70. 4.2 NER的方法
  71. 4.2.1 列表和正则表达式
  72. 4.2.2 统计分类器
  73. 4.3 使用正则表达式进行NER
  74. 4.3.1 使用Java的正则表达式来寻找实体
  75. 4.3.2 使用LingPipe的RegExChunker类
  76. 4.4 使用NLP API
  77. 4.4.1 使用OpenNLP进行NER
  78. 4.4.2 使用Stanford API进行NER
  79. 4.4.3 使用LingPipe进行NER
  80. 4.5 训练模型
  81. 4.6 本章小结
  82. 第5章 词性判断
  83. 5.1 词性标注
  84. 5.1.1 词性标注器的重要性
  85. 5.1.2 词性标注难在何处
  86. 5.2 使用NLP API
  87. 5.2.1 使用OpenNLP词性标注器
  88. 5.2.2 使用Stanford词性标注器
  89. 5.2.3 使用LingPipe词性标注器
  90. 5.2.4 训练OpenNLP词性标注模型
  91. 5.3 本章小结
  92. 第6章 文本分类
  93. 6.1 文本分类问题
  94. 6.2 情感分析介绍
  95. 6.3 文本分类技术
  96. 6.4 使用API进行文本分类
  97. 6.4.1 OpenNLP的使用
  98. 6.4.2 Stanford API的使用
  99. 6.4.3 使用LingPipe进行文本分类
  100. 6.5 本章小结
  101. 第7章 关系提取
  102. 7.1 关系类型
  103. 7.2 理解解析树
  104. 7.3 关系提取的应用
  105. 7.4 关系提取
  106. 7.5 使用NLP API
  107. 7.5.1 OpenNLP的使用
  108. 7.5.2 使用Stanford API
  109. 7.5.3 判断共指消解的实体
  110. 7.6 问答系统的关系提取
  111. 7.6.1 判断单词依赖关系
  112. 7.6.2 判断问题类型
  113. 7.6.3 搜索答案
  114. 7.7 本章小结
  115. 第8章 方法组合
  116. 8.1 准备数据
  117. 8.1.1 使用Boilerpipe从HTML中提取文本
  118. 8.1.2 使用POI从Word文档中提取文本
  119. 8.1.3 使用PDFBox从PDF文档中提取文本
  120. 8.2 流水线
  121. 8.2.1 使用Stanford流水线
  122. 8.2.2 在Standford流水线中使用多核处理器
  123. 8.3 创建一个文本搜索的流水线
  124. 8.4 本章小结