版本:pdf高清版 大小:13.29 MB
类别:电脑刊物 系统:WinXP, Win7, Win8, Win10
立即下载终极算法pdf是由多明戈斯书写的一本关于机器与人工智能相关书籍的pdf格式,可以让朋友们免费阅读这一本对人工智能影响最大的书籍,有兴趣的朋友就来IT猫扑下载吧!
机器学习已经快成为一种“刻奇”了,之所以这么说,不只是因为其在我们生活中的各个领域内都迁移默会的塑形着我们的生活与认知,更因为有太多的人对机器学习大数据一窍不通,却仍随着潮流,不得不在自己的PPT上加上大数据,仿佛这是一道魔咒,而《The master algorithm》 这本书,则是解码这道魔咒的明镜。这本书中,没有公式与代码,有的只是对机器学习中的算法本质一针见血的点破,有的只是依据这些算法而编出的日常生活中的故事,是对机器学习中核心算法的概念化的模型。一言以概之,这是一本所有有高中数学水平且无计算机背景的读者都能够读懂的科普书。如果你不想对控制着我们衣食住行方方面面的机器学习算法一无所知,那么这本书是你必读的书。
终极算法
多明戈斯在他的《终极算法》中认为机器学习将被明确归入全球经济未来的中心。随着数量的不断增多,我们使用的算法也可能不需要那么复杂,反而需要一种简单的、通用的算法,称之为“终极算法”。在多明戈斯的眼里,终极算法将会统一物理、数学、社会、生物等各种学科的理论,进而获得一种万有理论。他把宇宙生成、生命进化看成是一个程序,而不同的物种在不同时间、不同地点的生长、成熟和消灭都是由于程序设置的参数不同所导致的。他还分别从大脑皮层的统一、物理学规律的统一、进化论的规律、计算机科学本身的规律来分析了生成终极算法的可能性。多明戈斯也总结了目前机器学习的5大流派,分别是符号派、联结派、进化派、贝叶斯派、类推派。
五大门派
符号派认为所有信息都可以简化为操作符号,学习也不能从零开始,除了数据,还需要一定的原始知识。他们已经弄明白,如何把先前存在的知识并入学习中,如何结合动态的知识来解决问题。他们的主算法是逆向演绎,逆向演绎主要是弄明白,为了演绎的顺利,哪些知识被省略了,是什么让算法变得越来越综合。
联结派是学习大脑所做的事情,对大脑进行逆向演绎。大脑是通过神经元之间的连接强度来进行学习,关键问题是找到哪些连接导致了误差,怎么纠正这些误差。其主算法是反向传播算法,该算法将输出和想要的结果进行比较,然后一层一层往回改变神经元的连接,以更接近想要的结果。
进化派认为所有形式的学习都源于自然选择。在计算机上模仿自然选择,解决的关键问题就是学习结构:不只是像反向传播算法一样调整参数,还要创造大脑,对参数进行微调。进化派的主算法是基因编程,和自然使有机体交配进化一样,基因编程也对计算机进行配对和提升。
贝叶斯派最关注的是不确定性。所有掌握的知识都具有不确定性,而且学习过程也是一种不确定的推理形式。那么问题就变成,在不破坏信息的情况下,如何处理含噪声、不完整甚至矛盾的信息。解决的办法就是概率推理,而主算法就是贝叶斯定理及其衍生定理,贝叶斯定理将告诉我们如何利用已有的知识。
对于类推派来说,学习的关键就是要在不同的场景中认识到相似性,然后推理出其它的相似性。问题的关键就是如何判断两个事物的相似度。类推派的主算法是支持向量机,找出记忆的经历,以及如何将这些经历结合起来,用来做新的预测。
共性和个性
先把万能的终极算法放一边,先谈谈对一般算法的共性和个性。一般的算法都需要一个处理过程就是“特征工程”,而深度学习最大的好处就是特征的选择可以不需要人为的选择,给入足够多的数据,他都会逐层的把最重要的特征提取出来,所以如果要说这些算法的共性就是都是针对一定量的数据来提取相应的特征,再通过相应的特征来进行分类、聚类和预测等。但是每个算法都会对现实数据有一定的假设,比如贝叶斯算法就需要设定各项特征变量之间相互独立,同时每种算法的优化方式和内容也有一定的差距,给出来的结论也各有不同的形式可以是概率、也可以是类别等。每种算法的优缺点决定了其具体的应用场景。这样看来,要获得一个通用算法解决一切问题,还是存在一定困难的。正如各性化的人类,场景也是个性化的,需要有个性化的算法来应对,这样才能提高效率。但是,我认为机器学习可以从数据中找到统计规律,也一定能发现如“万有定律”一样普遍的规律,只是时间和机遇问题。当然,我也认同一点,宇宙万物的生存有一定的普适规律,但是这个规律是否可以用计算机算法的语言来描述则是另外一回事了。
量子算法
如果真的要考虑终极算法,我第一时间会想到量子算法,因为我对它是无知的,所以想象空间就越大,并且量子力学本身揭示的就是微观粒子的运动规律,符合“终极算法”想要找到万物普遍适用的核心思想。所以我就看了一些量子力学的论文,看看量子算法究竟是什么回事,虽然学过量子力学和原子核物理,但是理解相关的量子信息、量子计算、量子通信、量子算法等还是需要下一定功夫的。介绍一些有关概念算了,多的我也不懂:
1、量子:现代物理将微观世界中所有的微观粒子(光子、电子、原子)统称为量子
2、量子信息:利用微观粒子状态表示的信息成为量子信息
3、经典信息的基本存储单位是比特,只存在0和1两种状态,量子信息的基本存储单元是量子比特,有以有0到1之间的无限个状态
4、量子特性:
量子态相干性:微观系统中量子间相互干涉的现象
量子态纠缠性:N(大于1)个量子在特定的环境下可以处于稳定的量子纠缠态,对其中某个子系统的局域操作会影响到其余子系统的状态
量子态叠加性:量子状态可以叠加,量子信息也可以叠加
量子不可克隆:量子力学的线性特性确保对任意子态无法实现精确的复制。(不可复制和测不准原理成为量子密码的基础)
5、量子计算机:利用量子力学规律存储量子信息,实现量子计算的物理装置。
6、量子通讯:为了实现传送某个物体的未知量子态,可以原物的信息分成经典信息和量子信息两部分,分别由经典通道和量子通道传送。
算法的直觉
既然讲到了终极算法,我也想说说我对”算法的直觉”问题的理解。我们知道,人的大脑是由两个系统组成的,一个快系统和一个慢系统。快系统是感性的,是凭借直觉来判断事物,而慢系统则是理性的,通过思考来判断。既然这样,算法是理性的不用解释,那么算法是否也可以实现像人类一样的“直觉”呢?如果可以,那么机器人是否就可以存在“意识”呢?这个不好说,不过我觉得人类的直觉有时候就像是”扔骰子”,随机的,人也说不出来那种感觉是什么样的。可能正是因为这样,阿拉法狗的算法实现就使用了蒙特卡洛树的算法(蒙特卡洛算法是一种随机过程的算法,核物理中可以用来模拟光子、原子、电子等量子的随机游走过程),因此随机游走的过程是否真的可以用来模拟人类的直觉呢?还有,量子算法结合蒙特卡洛等随机过程是否可以实现“终极算法”呢?
观点
1、不要和人工智能对抗,要让人工智能为你服务
2、要利用好机器学习这个工具,并不一定要读一个计算机博士学位,但有必要了解一些基本的概念,了解各种技术的优缺点和能力边界。
3、计算机给自己编程、自己设计算法
4、机器学习是“太阳的新鲜事”,一种能够构建自我的技术。
5、学习算法就像是技艺精湛的工匠,它产生的每个产品都不一样,而且专门根据用户的需要精细定制。
6、学习算法就是把数据变成算法。它们掌握的数据越多,算法也就越精准。
7、可以预测和难以预测的之间的鸿沟要交给机器学习来填补。
8、学习算法就是要找到两个事物之间的联结点。
9、创建一个算法并不一定要从数学公式出发,而是要站在一个更高的应用角度去思考,对已有的算法投入过多的精力也会影响建立新算法的能力,但是要学会联系各种算法的特点并运用到新的算法中。
10、“语言”让程序员变成创造世界的“神”
11、复杂的算法、大脑不能很好理解的算法就容易引入误差。
12、学习算法是种子,数据是土壤,被掌握的程序是成熟的作物。
13、谁有最多的数据、最佳的算法、谁就能有更多的用户。这是一个良性循环。
查看全部