400-123-4567

茶叶常识分类

【开云(中国)Kaiyun·官方网站，开云(中国)Kaiyun】关于机器学习，你所知道的，可能都是错的

本文摘要：按，虽然机器学习早已沦为一个高频名词，但是对于大众而言，它仍然是一个遥不可及乃至模糊不清的概念。

按，虽然机器学习早已沦为一个高频名词，但是对于大众而言，它仍然是一个遥不可及乃至模糊不清的概念。为此，知名投资人 Benedict Evans 在自己的博客上公开发表博文，针对这一问题传达了自己的观点；对这篇博文展开了不转变本意的编译器。机器学习的风潮早已风吹了四五年了，除了以 AI 名为如雨后春笋般较慢兴起的新创公司们，各家科技巨头也期望环绕这个时髦词“重塑金身”。

此外，通过媒体的大肆宣传，机器学习也早已出了一个家喻户晓的名词。总之，机器学习将沦为下一个能老大“猪”降落的风口早已是大家的共识。在月开始之前，我们再行说道说道人工智能（AI），机器学习，神经网络和深度自学四者的关联。

非常简单来说，人工智能的范畴仅次于，机器学习包括在内，它是带给人工智能的方法。至于神经网络，则是机器学习众多算法中的一类，而深度自学则是构建机器学习的技术，是它的一种伸延。经过这么多年的科学知识普及，难道解读（理论上）神经网络是什么的人早已相当多，最少大家都告诉它与范式和数据有关。

机器学习让我们能在数据中寻找那些暗示性和随机性的范式或结构，而在此之前能寻找这些说明了属性的只有人类，因为我们不会推理小说。有了机器学习，那些原本对人类来说非常非常简单（或者说无法向计算机叙述的问题）但却能难倒计算机的问题就迎刃而解了，各路公司也都拿走了非常炫酷的展示。不过，笔者仍然指出，对于机器学习的定义，整个行业仍然没一个相同的解读，一切都还并未尘埃落定。对于科技公司或整体经济来说它究竟意味著什么？机器学习究竟能解决问题什么最重要问题？它对于普罗大众又意味著什么？如何从结构上解读它的影响呢？这时有人不会抬 AI 这个术语，不过它只不过一个问题都问没法，它就像《2001 太空漫游》中提及的黑色巨石（代表未解之谜），在它面前我们都是手持着拳头嚎叫的猩猩，想要解构 AI 完全是不有可能已完成的任务。

事实上，我实在现在大家能明确提出一大串多余的方法来辩论机器学习的发展程度。举例来说：1. 数据是新的石油2. 谷歌和中国摘得了所有数据3. AI 将偷走所有工作4. 只谈论 AI或许，我们能去找个更加多简单的角度，比如：1. 自动化2. 为技术层赋能3. 关系数据库为什么要提及关系数据库呢？因为它们是新的基础赋能层，可以不断扩大计算机的能力范围。

在关系数据库经常出现之前（上世纪 70 年代末），如果你想要让数据库告诉他你“住在这座城市里的人谁买了这件商品”，就必需专门做个自定义版的工程项目。也就是说，当时的数据库创建时没结构，因此想要构建给定的交叉提到查找可是个难事。如果你想要问个问题，就得有人环绕这个问题下大功夫工作一番。

当时的数据库只是一套记录系统，但关系数据库的经常出现让它们演化出了商业智能系统。这样的转变也让数据库的重要性急剧减少，新的用例预示独角兽们如雨后春笋般问世。

关系数据库的问世给了我们甲骨文和 SAP 公司，而 SAP 和竞争对手们又一起为世界带给了全球无库存式供应链，在这一技术的基础上，苹果和星巴克等公司创下了自己的帝国。上世纪 90 年代，完全所有企业级软件都改用了关系数据库，还包括 PeopleSoft，CRM 和 SuccessFactors 都是基于关系数据库运营的产品。

此役之后，再也不会有人屌兮兮的说道“不行的，甲骨文早就吃所有数据库”这种话了。忽略，这项技术完全出了所有新事物的赋能层，它已无处不在。因此，这一思路才是我们现在新的思维机器学习的最佳短路方式，它不会给计算机能力带给极大的跃居，沦为有所不同公司有所不同产品中的一部分。最后，机器学习也不会无处不在，沦为大家习以为常甚至都不愿再提的一项技术。

值得一提的是，虽然关系数据库具备规模经济效应，但它获取的显然一个受限网络或“赢家通吃”的效应。也就是说，即使公司 A 和公司 B 买了同一个数据库软件，两家公司也会从对方那里受益。

机器学习也遵循某种程度的道理，它的一切都与数据有关，但数据又与特定的应用程序息息相关。更好的笔迹数据只不会提升它任笔迹的能力，而更加多的燃气轮机数据让系统能提早预测故障，但两者并无法互相扶植。

这就是其残忍之处，数据是不能替代的。上面这段话只不过完全攥寄居了我们对于机器学习广泛误会的核心，即在或许上来看，它是一个单一的标准化的事物。同时，在解读什么是自动化时我们也罪了完全相同错误。

在每一次自动化风潮来临时，我们都感觉自己在建构一种拟人的且有基本智力的技术。举例来说，上世纪 50 年代，人类开始飨宴能做到家务和上菜的机器人，结果我们没有培育出有机器人服务生，反而用上了洗衣机。洗衣机也是机器人，不过它们并非“智能”机器人。它们不确切水和衣服究竟是何物。

此外，即使是在洗净这个分类中，它们也并非标准化产品，要不然洗碗机也会问世了。非常简单来说，它们只是另一种形式的自动化，在概念上和传送带没什么有所不同。某种程度的，机器学习显然能让我们解决问题许多现在电脑搞不定的问题，不过这些问题认同都必须有所不同的构建方式和有所不同的数据，甚至是有所不同的市场策略和开发公司，而这其中的每一环都是自动化的一块积木，它们是一个个能继续执行有所不同任务的洗净设备。因此，在谈论机器学习时我们认同不会遭遇“拦路虎”，即我们要在数学的机械论说明和对人工智能的幻想中寻找中间立场。

让我们返回与关系数据库的转换话题，现在我们显然能信心满满的说道，这项技术能解决问题大量问题，但你并不知道是哪些明确问题。你能用机器学习展开令人印象深刻印象的语音和图像识别展出，但普通公司用它来干什么呢？就像一家美国媒体公司说道的：“有了机器学习，我们显然能一次给十年的专访节目做到索引，但我们要在索引里去找什么呢？”那么什么才是有确实用途的机器学习洗净机呢？要答案这个问题，我指出必须中用两种工具。第一种是按照数据类型和问题类型的队列展开思维。

1. 机器学习显然能在你所享有的数据中较慢寻找问题答案，你甚至可以将它看作一种分析或优化技术。举例来说，我们的投资公司 Instacart 就打造出了一套系统，专门用来优化个人买家通过集中渠道展开投资的路径。这套系统必要将效率提高了 50%，而且研发团队只有三名工程师（用了谷歌的开源工具）。2. 同时，机器学习还能让你在数据中寻找新问题的答案。

举例来说，一位正在为打官司做到打算的律师可以搜寻到包括“气愤”、“担忧”或“异常”意味的邮件，这样就比全然的关键词搜寻高效多了。3. 机器学习关上了新的大门，给了我们可以分析的新数据类型。从前计算机无法确实的背诵音频、图像或视频，但未来这一切都有可能成真为。在这三种数据类型中，我找到图像最有意思。

计算机问世伊始，就能处置文本和数字，但图像和视频毕竟它们的软肋，现在它们不但能读书，还能看了。这就意味著图像传感器和麦克风出了一种全新的输出机制，它们摄像头的属性被机读数据流生成器属性垫过。

所有的事都会沦为计算出来视觉问题，但这里的计算出来视觉问题又与当下的计算出来视觉问题有所不同。这又与辨识“猫片”牵涉到。

最近我参观了一家汽车座椅供应商，它们就在自家的廉价 DSP 芯片中倒入了神经网络，而与其因应的则是廉价的智能手机图像传感器。它们搭起这套系统，是为了查询座椅织物中的褶皱。

将这套系统称作“人工智能”有些言过其实了，它只不过是将某种此前无法自动化的任务自动化了而已。这种自动化的感觉是我们思维有关机器学习问题的第二种工具。对人来说，找找织物中的褶皱能用没法二十年的经验累积，因为它过于非常简单了。

事实上，我的同事就指出，那些无论如何训练，狗狗都习会的能力，机器学习都能掌控。这有益我们思维有关 AI 种族主义的问题，但还是有自己的局限性。因为狗狗可没一般智力和常识，而神经网络可有所不同。吴恩达就认为，机器学习能在一秒钟之内习回头你的能力。

五年之前，如果你给计算机一堆图片来辨识，它们能做到的只是区分这些图片的尺寸，而十岁的小孩很精彩就能辨别出有照片中的男人和女人，而十五岁的小孩则能显现出照片里的面孔傻不酷，而再行长大几岁去进修时，人甚至能显现出照片中的直白的意味。有了机器学习后，计算机的能力立刻就提高到十岁孩子的级别，它们甚至能冲击下十五岁的智商。

机器学习有可能总有一天约将近实习生的水平，但如果你手上有 100 万个十五岁孩子来交给数据呢？你不会命令他们做到什么？听得什么电话？看什么图片？审查什么文件或信用卡缴纳呢？换言之，机器学习不必须沦为享有几十年经验的“杨家司机”，我们也不是要让专家沦为自动化的“牺牲品”。忽略，我们对机器学习的主要拒绝是“电话所有电话并挑那些生气的人”，“读者所有邮件并找到那些剩是情绪的邮件”，“看遍成千上万张照片并寻找那些照片中的炫酷人类”。在某种程度上，这就是自动化的惯例。Excel 没有给我们人工会计员，PS 也没给我们人工图片设计师。

忽略，我们大规模自动化了线性的任务。在某些领域，机器学习有可能去找将近人类早已认识到的东西，但它们却能寻找我们了解将近的或者范式、假设或似乎，就像 Deepmind 的 AlphaGo 那样。AlphaGo 并会像棋士运动员那样对局，而是再行学会规则随后展开大大的左右互搏。如果机器学习当作着实习生的角色，它们会一开始就告诉他你某张照片很好看，而是在看见第三百万张图片时，找到其中的范式。

那么，究竟哪个领域小到让我们能告诉他机器学习系统明确的规则，以便它们能在数据中挖掘出新的成果呢？我花上了很多时间游历各家公司以找寻它们的技术市场需求，在机器学习上似乎它们早已有许多将要成熟期的浆果。不过，这里显然还有许多显著的分析和优化问题，有些则是图像识别或音频分析问题。我们辩论自动驾驶汽车和混合现实是因为机器学习出了它们的催化剂。

机器学习让汽车能看见它周围事物的一举一动，至于混合现实，机器学习则要求了头盔配戴者究竟能看见什么。不过，在辩论过织物上的褶皱或呼叫中心的情感分析后，这些公司又有了新问题：“机器学习还有其他能耐吗？它们还能助力什么技术？又能找到什么新机遇？”在沮丧这些问题之前，我们难道还能维持 10-15 年的新鲜感。

viaben-evans，(公众号：)编译器。原创文章，予以许可禁令刊登。下文闻刊登须知。

本文关键词：开云(中国)Kaiyun·官方网站,开云(中国)Kaiyun

本文来源：开云(中国)Kaiyun·官方网站，开云(中国)Kaiyun-www.educgw.com