机器学习相关书籍2
作者:(美)德鲁·康威/约翰·迈尔斯·怀特译者:陈开江/刘/孟晓楠/罗森林修订出版社:机械工业出版社页码:320定价:69.00 ISBN:978711417365438+。它不想成为一本关于机器学习的参考书或理论书。它侧重于一个学习过程,所以对于任何有一定编程背景和量化思维的人来说都是不错的选择。
——马克斯·史隆·奥克丘比特
机器学习是计算机科学和人工智能中一个非常重要的研究领域。机器学习不仅在计算机科学的许多领域发挥着重要作用,而且在一些交叉学科中也成为重要的支撑技术。本书全面系统地介绍了机器学习的方法和技术,不仅详细阐述了许多经典的学习方法,还探讨了一些具有生命力的新理论和新方法。全书案例中既有分类问题,也有回归问题;它包括监督学习和非监督学习。本书讨论的案例从分类到回归,然后讨论聚类、降维、优化等等。这些案例包括分类:垃圾邮件识别、排序、智能收件箱、回归模型、预测网页访问、正则化、文本回归、优化、密码破解、无监督学习、构建股市指数、空间相似性、用投票记录聚类美国参议员、推荐系统、向用户推荐R语言包、社交网络分析、对Twitter感兴趣的人、模型比较、为你的问题找到最佳算法。各章对原理的描述力求概念清晰,表达准确,突出理论联系实际,启发性强,通俗易懂。在探索这些案例的过程中使用的基本工具是R统计编程语言。r语言非常适合机器学习的案例研究,因为它是一种数据分析的高级函数式脚本语言。
本书主要内容:开发一个朴素贝叶斯分类器,仅根据邮件的文本信息来判断这封邮件是否是垃圾邮件;使用线性回归预测互联网上排名前1000的网站的PV;利用文本回归理解书中词语之间的关系;通过尝试破译一个简单的密码来学习优化技术;利用无监督学习构建股市指数,衡量整体市场情况;根据美国参议院的投票情况,从统计学角度对美国参议员进行聚类;通过K近邻算法构造向用户推荐R的语言包;利用Twitter数据,为“你可能感兴趣的人”建立推荐系统;模型比较:为你的问题找到最佳算法。德鲁·康威(Drew Conway)是一名机器学习专家,在数据分析和处理方面有着丰富的经验。主要运用数学、统计学和计算机技术研究国际关系、冲突和恐怖主义。他在美国情报和国防部做了几年的研究员。他拥有纽约大学政治科学系的博士学位,并为各种杂志撰写过文章。他是机器学习领域的著名学者。
约翰·迈尔斯·怀特(John Myles White)是一名机器学习专家,在数据分析和处理方面经验丰富。主要从理论和实验的角度研究人类如何决策,也是几个流行的R语言包的主要维护者,包括ProjectTemplate和log4r。他拥有普林斯顿大学的哲学博士学位,为许多技术杂志撰写过文章,发表过许多关于机器学习的论文,并在许多国际会议上发表过演讲。罗森林
博士,教授,博士生导师。现任北京理工大学信息系统与安全对策实验中心主任、专业责任教授。国防科学技术工业局科学技术委员会委员;《中国医学影像技术杂志》和《中国介入影像与治疗学》编委;全国大学生信息安全技术邀请赛专家组副组长;中国人工智能学会智能信息安全专业委员会委员等。主要研究方向为信息安全、数据挖掘、媒体计算和中文信息处理。负责或参与完成国家自然科学基金、国家科技支撑计划、863计划、国家242计划等40余项省部级项目。发表学术论文90余篇,著作8部,翻译1篇,专利3项。
陈开江
新浪微博搜索部R&D工程师,曾独立负责微博内容反垃圾系统、微博特色内容挖掘算法、自助客服系统(包括自动回复、主动挖掘、舆情监测)等项目,主要从事社交挖掘、推荐算法研究、机器学习、自然语言处理等相关工作,研究兴趣为社交网络个性化推荐。
刘·
阿里巴巴,CBU基础平台部搜索推荐团队核心技术及查询分析方向负责人,机器学习技术领域及圈子负责人。算法工程师,前雅虎!中国的相关团队和自然语言处理团队;AvePoint.inc开发工程师,从事企业搜索引擎开发。研究方向为机器学习、自然语言处理、个性化推荐等算法在大规模数据中的应用。
孟晓楠
淘广告技术,阿里不是搜索广告算法负责人,负责用户行为分析、建模和细分、RTB竞价算法、展示广告的CTR预测和SEM优化。曾在网易杭州研究院工作,参与网易博客产品的分布式全文检索系统和数据挖掘算法的开发。研究方向为计算广告技术、机器学习、大数据技术、信息检索等。