注重体验与质量的电子书资源下载网站
分类于: 互联网 编程语言
简介
数据算法:Hadoop、Spark大数据处理技巧 豆 7.1分
资源最后更新于 2020-07-05 18:57:30
作者:Mahmoud Parsian
出版社:中国电力出版社
出版日期:2016-10-1
ISBN:9787512395947
文件格式: pdf
简介· · · · · ·
《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。主要内容包括:■ 完成超大量交易的购物篮分析。■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。■ 使用超大基因组数据完成DNA和RNA测序。■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。■ 推荐算法和成对文档相似性。■ 线性回归、Cox回归和皮尔逊(Pearson)相关分析。■ 等位基因频率和DNA挖掘。■ 社交网络分析(推荐系统、三角形计数和情感分析)。