1.机器学习概述
1.1人工智能概述
1.1.1机器学习与人工智能、深度学习
-
机器学习和人工智能,深度学习的关系
机器学习是人工智能的一个实现途径
- 深度学习是机器学习的一个方法发展而来
达特茅斯会议-人工智能的起点
1956年8月,在美国汉诺斯小镇宁静的达特茅斯学院中,
约翰·麦卡锡(John McCarthy)
马文·闵斯基(Marvin Minsky,人工智能与认知学专家)
克劳德·香农(Claude Shannon,信息论的创始人)
艾伦·纽厄尔(Allen Newell,计算机科学家)
赫伯特·西蒙(Herbert Simon,诺贝尔经济学奖得主)等科学家正聚在一起,讨论着一个完全不食人间烟火的主题:
用机器来模仿人类学习以及其他方面的智能。
会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字:人工智能
因此,1956年也就成为了人工智能元年。
1.1.2 机器学习、深度学习能做些什么
-
用在挖掘、预测领域:
应用场景:店铺销量预测、量化投资、广告推荐、企业客户分类、SQL语句安全检测分类…
用在图像领域:
- 应用场景:街道交通标志检测、人脸识别等等
用在自然语言处理领域:
- 应用场景:文本分类、情感分析、自动聊天、文本检测等等
1.2 什么是机器学习
1.2.1 定义
机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。
1.2.2理解
人类从大量的日常经验中归纳规律,当面临新的问题的时候,就可以利用以往总结的规律去分析现实状况,采取最佳策略。
例如:
- 从数据(大量的猫和狗的图片)中自动分析获得模型(辨别猫和狗的规律),从而使机器拥有识别猫和狗的能力。
- 从数据(房屋的各种信息)中自动分析获得模型(判断房屋价格的规律),从而使机器拥有预测房屋价格的能力。
1.2.3 数据集构成
- 结构:特征值+目标值
注:每一行数据被称为一个样本,目标值不是必须存在的,但是会存在特征值。
1.3 机器学习算法分类
分类:
- 特征值:猫/狗的图片;目标值:猫/狗-类别
- 分类问题
- 特征值:房屋的各个属性信息;目标值:房屋价格-连续型数据
- 回归问题
- 特征值:人物的各个属性信息;目标值:无
- 无监督学习
1.3.1小结
1.3.2机器学习算法分类
- 监督学习(supervised learning)(预测)定义:输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类)。
- 分类 k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络
- 回归 线性回归、岭回归
- 定义:输入数据是由输入特征值所组成。
1.4 机器学习开发流程
注:参考了黑马程序员相关资料。