您的位置：首页 >资讯 > 科技 >

新颖的数学可以将机器学习提升到新的水平

2019-09-09 10:33:19 来源：

导读意大利数学家团队，包括来自葡萄牙里斯本Champalimaud未知中心(CCU)的神经科学家，已经证明人造视觉机器可以通过使用25年前开发的数学理论

意大利数学家团队，包括来自葡萄牙里斯本Champalimaud未知中心(CCU)的神经科学家，已经证明人造视觉机器可以通过使用25年前开发的数学理论学习更快地识别复杂图像这项新研究的合着者之一。他们的研究结果发表在Nature Machine Intelligence杂志上。

近几十年来，机器视觉性能得到了极大的改善。人工系统现在可以学会识别几乎任何人脸或识别在坦克中移动的任何单个鱼。

事实上，这种机器是生物神经元网络的电子模型，它们的目的是模拟大脑的功能，这些功能在这些视觉任务方面表现优异，而我们没有任何有意识的努力。

但这些人工神经网络实际上是如何学习的?例如，在面部识别的情况下，他们通过以一系列肖像的形式获取关于人脸的外观的经验来做到这一点。更具体地，在被数字化为像素值矩阵之后，每个图像在神经网络内“嘎吱” ，然后从该组样本面(例如眼睛，嘴巴，鼻子等)中提取一般的，有意义的特征。

这种深度学习使机器能够吐出另一组值，从而使它能够在面部数据库(很像指纹数据库)中识别以前从未见过的面部，从而预测该面部属于谁非常准确。

聪明汉斯的故事

但是在神经网络能够很好地执行此操作之前，通常需要为其提供数千个面(即数字矩阵)。此外，虽然这些机器在模式识别方面越来越成功，但事实是没有人真正知道在学习任务时内部发生了什么。它们基本上都是黑盒子。

这意味着无法确定机器实际从初始数据中提取哪些或多少特征 - 甚至有多少这些特征对于人脸识别真正有意义。

“为了说明这一点，请考虑智者的范式，”在CCU的系统神经科学实验室工作的Mattia Bergomi研究的第一作者说。这个故事，从20世纪初开始，关注德国一匹名为Clever Hans的马，他的主人声称已经学会了算术，并通过在地面上盖上他的一个前蹄来宣布加法，减法等的结果。适当的次数。很多人都相信他可以数数; “纽约时报”甚至报道了这匹马。然而，在1907年，一位德国心理学家表明，事实上，这匹马正在以他的主人的肢体语言拾取无意识的线索，告诉它何时停止敲击。

“这与机器学习是一样的;无法控制它的工作方式，或者在培训过程中学到的东西，”Bergomi解释道。机器，没有面孔的先验知识，只是以某种方式做它的东西 - 它的工作原理。

这导致研究人员询问是否可能有一种方法在训练之前将关于面部或其他物体的现实世界的一些知识注入神经网络，以便使其探索更有限的可能特征空间而不是全部考虑它们 - 包括现实世界中不可能的那些。“我们希望控制学习特征的空间，”Bergomi说。“它类似于平庸的国际象棋选手和专家之间的差异：第一个看到所有可能的动作，而后者只看到好的动作，”他补充道。

他说，另一种说法就是说“我们的研究解决了以下简单的问题：当我们训练深度神经网络来区分道路标志时，我们怎样才能告诉网络如果它只是它的工作会更容易必须关心简单的几何形状，如圆形和三角形?“

科学家们推断这种方法可以大大缩短培训时间 - 而且重要的是，给他们提示机器可能在做什么来获得结果。他说：“允许人类推动学习机器的学习过程，是实现更易于理解的人工智能的基础，并减少当前神经网络需要的时间和资源的暴涨成本，以便接受培训。”

什么是形状?

一种称为拓扑数据分析(TDA)的抽象数学理论是关键。TDA开发的第一步是由意大利数学家Patrizio Frosini在1992年拍摄的，他是新研究的合着者，目前在博洛尼亚大学。“拓扑是最纯粹的数学形式之一，”Bergomi说。“直到最近，人们还认为拓扑结构长期不适用于任何具体的东西，直到TDA在过去几年变得众所周知。”

拓扑是一种扩展几何，它不是测量刚性形状(如三角形，正方形，圆锥形等)中的直线和角度，而是根据它们的形状对高度复杂的对象进行分类。例如，对于拓扑学家来说，圆环和杯子是相同的物体：一个可以通过拉伸或压缩变形到另一个中。

现在，问题是，当前的神经网络不擅长拓扑。例如，他们不识别旋转的对象。对于他们来说，每次旋转时，相同的对象看起来都会完全不同。这正是为什么唯一的解决方案是让这些网络单独“记住”每个配置 - 成千上万。这正是作者计划通过使用TDA避免的。

可以将TDA视为一种数学工具，用于在任何可以表示为一组庞大数字的复杂对象中找到有意义的内部结构(拓扑特征)。这是通过某些精心挑选的“镜头”或过滤器查看数据来实现的。数据本身可以是面孔，金融交易或癌症存活率。TDA使得教导神经网络识别面部成为可能，而不必将其呈现在面部可能在空间中呈现的每个不同取向。现在，即使在不同的旋转位置，机器也会将所有面部识别为面部。

在他们的研究中，科学家们通过教授神经网络来识别手写数字来测试结合机器学习和TDA的好处。结果不言自明。

由于这些网络是不好的拓扑学家，并且手写可能非常模糊，因此两个不同的手写数字可能无法与当前机器区分开来 - 相反，它们可能将同一个手写数字的两个实例识别为不同。该任务需要展示网络，该网络对现实世界中的数字一无所知，用各种倾斜，书法等编写了10个数字中的每一个的数千张图像。

为了注入有关数字的知识，该团队构建了一组他们认为有意义的先验功能 - 换句话说，一组“镜头”，网络将通过它们看到数字 - 并迫使机器在这些镜头中进行选择在图像上。TDA增强神经网络学习区分五人与七人之间所需的图像数量(即时间)，无论写得多么糟糕，同时保持其预测能力，都下降到不到50。

“我们在研究中数学上描述的是如何强制执行某些对称性，这提供了一种策略来构建机器学习代理，这些代理能够通过利用作为约束注入的知识从少数例子中学习显着特征，”Bergomi说。。

这是否意味着模仿大脑的学习机器的内部运作在未来会变得更加透明，从而能够对大脑本身的运作方式有新的见解?无论如何，这是Bergomi的目标之一。“人工智能的可懂度对于其与生物智能的相互作用和整合是必要的，”他说。他目前正在与他的同事Pietro Vertechi合作开发一种新型神经网络架构，该架构将允许人们迅速将高级知识注入这些网络，以控制和加速他们的训练。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：机器学习