乔姆斯基专访：深度学习并没有探寻世界本质

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

粗眉毛的电脑桌 · 【前端】js ...· 10 月前 ·

爱听歌的铁链 · nginx证书填写路径报错：SSL: ...· 11 月前 ·

谦虚好学的石榴 · 【CSS】鼠标经过父元素时，如何改变其下所有 ...· 1 年前 ·

温暖的面包 · 轻松学Pytorch-使用torchvisi ...· 1 年前 ·

还单身的蘑菇 · 请问下怎样根据HRTEM作出的FFT图确定晶 ...· 1 年前 ·

乔姆斯基专访：深度学习并没有探寻世界本质

整理 | 蒋宝尚

乔姆斯基是一位开创性的人物，尤其是他那本《句法结构》被认为是20世纪理论语言学研究上最伟大的贡献。

不光《句法结构》，还有《现代希伯莱语语素音位学》、《转换分析》等一系列语言学著作传达了对多种正规语言的洞见，也对计算机科学产生了重要的影响。

据说，乔姆斯基的语言模式也可从数学的角度来讨论，这也引起了数学家，尤其是组合数学家的兴趣。
近日，MIT的 AI 科学家 Lex Fridman 对乔姆斯基进行了专访，在接受采访的时候，从外星人谈到了语言学，然后谈到了深度学习，并探讨了人类哲学。他认为深度学习当前都在学习大量的例子，没有对本质进行探寻。另外，他还认为我们人类的意义由我们自己决定，人类什么样的行动就人类存在的意义......

（雷锋网） AI科技评论在不改变原意的情况下对专访进行翻译，请欣赏~

问：如果外星人造访地球，你认为我们能找到与他们沟通的共同语言么？

答：是可以的。

大约在二三十年前，马文·明斯基就和他的学生一起做了一个实验：不加限制条件的运行最简单的图灵机，看看会发生什么？结果是大多数要么死机，要么进入无限循环，只有少数给出了类似算术的东西。所以马文得出结论：如果高智商的外星人造访地球，那么他们至少会做一些简单的算术。实际上，马文并不知道，自然语言的核心原理是在极限情况产生类似于算术的运算。所以，基于人类语言的核心属性或者算术的核心属性可以建立一种普遍共享的交流模式。

问：语言的结构是什么？语言在我们头脑中的内部系统与它所表达的外部结构有何不同。

答：这是两种不同的语言概念，两个概念是同时存在的。你本身的一些属性决定了你要说的是英文，而不是其他语言，所以有一个内在的系统，并且是局部性存在于你的大脑中决定了你的表达，和笔记本电脑的内部结构类似，这个系统也属于大脑中的特定配置。

你也可以用语言外化脑海中的东西，但是我们对语言的使用，大多数数是内在的思考，而我们正在外化的那套东西是一个外部系统。

问：像视觉等基本的东西都是从人类头脑中涌现的么？

答：在某种程度上，是由我们的基因决定。基因决定了我们拥有的是哺乳动物而不是昆虫的视觉系统，基因决定了我们拥有人类的语言能力。

早在几个世纪前的工业革命时期，就已经有人认为语言是人类认知本质的核心，是思想的源泉，是构建思想和表达思想的方式，并且语言具有基本的创造能力，是自由、独立、无拘无束.......

确实，语言是我们人类非凡能力的基础，但这些能力帮助人类取得是一些并不那么伟大，但同时又有那么点独特的成就。

问：思考和推理的能力和语言有很深的联系么？内在的语言系统本质上是内部推理的机制么？

答：语言肯定是推理的机制，但我们还有更多的科学天赋，没人知道这个天赋到底是什么，但是它却能确定什么是有意义的，什么是没有意义的。我们本身在使用语言，但同时也获得了超出范围的理解。

问：您能尝试定义什么是极限么？您认为有可能找到人类认知的极限么？

答：大多数科学家认为，人类智力原则上可以回答任何问题，但这是一个非常奇怪的信念。我们不是神，所以我们的能力存在范围和界限。举个例子，遗传因素决定了你是一个丰富而复杂的有机体，也让你拥有了哺乳动物的视觉系统以及手臂，这个遗传因素规定了人类发展的方向，阻止其他方向的发展，例如，胚胎出来的动物没有发育成昆虫。因此在赋予丰富性和复杂性的同时也限制了所能获得的东西。

假设我们的认知能力是世界的一部分，那么它们就应该具有相同的属性，并形成了丰富和复杂结构的内在能力，同时规定了“方向”，所以认知有极限。

（雷锋网）

举例来说，在牛顿时代，从伽利略到牛顿，现在科学的发展都基于一个基本的假设：世界，宇宙整体是个机械体。这里的机械体类似于齿轮、杠杠等概念。

所以，他们认为这个世界只是一个更加复杂一些的机械变体。但是令牛顿苦恼的是，他证明了世界上没有机器、没有接触就可以存在相互作用。

与牛顿同时代的人，如莱布尼兹和惠更斯认为这回到了“神秘主义”，牛顿对此表示同意。事实上牛顿和许多其他科学家一样，用他的余生试图以某种方式绕过它。所以，理论不会产生一个可理解的世界，除非你可以在机器上复制它，而它又证明了没有机器。

译者注：牛顿、惠更斯等人在内都认为超距作用是不可能的。

经过漫长的斗争，科学家们花了很长时间接受这个常识，但同时这也意味着他们放弃了对一个可理解的世界的探索。大卫·休谟曾经说过，牛顿通过展示他留给我们的机械哲学、机械科学的不完美来揭开自然界的许多秘密，仍然存在着永远存在的奥秘，科学只是改变了目标。

科学只是抛弃了谜团，如果不能解决，它会把迷团放在一边。对于我们而言，我们只是找到了通俗易懂的理论，牛顿的理论是可以理解的。

这一切都表明了人类认知的局限性，我们寻找可理解的世界的目标，从伽利略到牛顿，都是对事物如何运作的本能构想，都是机械哲学。

这和我们想要一个有规则的几何图形的世界一样，正如笛卡尔指出的那样，即使世界上没有三角形的事物，我们也会有三角形的观念。其实在我们心中，我们只是根据完美的几何物体强加了一种世界的概念。

问：这样就给我们暗示了认知的潜在限制么？

答：个人认为确实如此，但这是一个非常有争议的观点，如果你询问科学家，他们会说不可能，我们什么都可以理解。

问：已经有公司在做脑机接口，他们想着扩大大脑获取信息的能力，您认为这会扩展我们的认知能力、语言能力、推理能力么？

答：可以认为某种意义上的扩展，此类想法在几千年前就已经存在了。可以通过读一本书扩展认知能力，所以脑机接口也是扩展。没有什么能够超出我们天生的认知能力，就像不能把哺乳动物的视觉系统变成昆虫系统一样。

问：也许你不能直接去想，但是你可以了解信息？

答：没有此类实验，你可以描绘蜜蜂看到的东西，并用一种形式呈现出来，这样似乎我们能够利用这个东西了。事实上，蜜蜂科学家已经这么做了。

问：您认为我们可以描绘的东西其实比蜜蜂大，然后发现一些东西，让我们能够理解量子世界，量子力学么？

答：你可以，麻省理工的学生能够学习和理解量子力学。

问：其实他们也不是真的理解。

答：不是物理意义上的，这可能另一个理解有限的领域，其实我们理解这些理论，但它描述的世界没有任何意义。例如薛定谔的猫，你可以理解这个理论，但正如薛定谔指出那样，这并不是一个可以理解的世界。爱因斯坦是一个经典的现实主义者，所以他总是怀疑量子理论。

问：你在语言学或认知科学中看到的语言或思想中最迷人的方面是什么？

答：我认为语言最深层的属性或者最令人费解的属性是一种结构性依赖的东西。现在我们对它很了解，但之前却令人费解了很长一段时间。

举例来说，这家伙修车小心翼翼地打包工具（the guy who fixed the car carefully packed his tools），这句话其实是令人模棱两可的，它所表达的意思可以是小心翼翼的修理汽车，也可以是小心的打包他的工具。副词与哪个动词相关的（是离最近的还是最远的）是一个非常令人费解的事情。

问：你认为深度学习，或者基于神经网络的机器学习的极限是什么？

答：要给出一个真实的答案，必须要了解发生事情的确切过程，如果这些过程是不透明的，那么很难清晰的证明可以做什么，不可以做什么。

抛开细节不谈，深度学习现在正在做的是收集大量的例子，并试图找到一些模式。这在某些方面可能会很有趣，但我还是想问：AI是工学还是理学？工学的意义是试图理解关于世界元素的东西，所以他可能需要一个谷歌翻译器。

它有用么？非常有用，所以从工学的角度来说，谷歌翻译器非常有用。但是它有没有告诉我们关于人类语言的事情？显然没有。所以，从一开始它就已经远离了科学。

谷歌翻译器是如何工作的呢？它需要一个巨大的文本，例如华尔街日报语料库，然后其想达到的目标是离语料库的正确描述越来越近。实际上语料库中每句话都是一个实验，你所说的每一句话都是一个实验，都想弄明白话语是否符合语法？

所以，我们可以问问自己有没有什么科学可以采取随机的实验，即没有目的的进行实验？比如，一名化学博士生，他在写一篇论文，论文没有明确的目的，只是将很多东西随意的混合，然后抱着“也许”的心态，看是否能发现一些东西。

显然，这名博士生会赶出实验室。

科学都是试图找到批判性的实验，这些实验可以回答一些理论问题。

谷歌翻译器一开始就离科学很远，而且一直如此。针对翻译器，人们只是文谷歌翻译器在语料上做的有多好？然后一直忽略了另一个从未提及的问题：在违反语言规则的事情上，它做的有多好？

以前面提到的结构依赖为例子，假设有一种语言，使用线性邻近作为解释模型，深度学习也能很容易利用这一点。有了这个模型就意味着学习语言是一件简单的事情，但从科学的角度来看，这是一个失败，我们其实并没有发现本质。

问：神经网络看起来像是一种近似器，在辩论中回荡着正确的行为主义。但我认为，当数据集很大时，实际上有一些根本不同的东西。您认为我们可以用神经网络来学习，表示复杂的语言结构么？它会以某种方式帮助我们理解科学么？

答：有可能，可能会发现没有注意到的模式，比如，有一种语言，使用者都已经消失，只有一些记录。我们能做的是从记录中发现一些什么，如果有说这种语言的人还存活，那么这个人不比什么样的实验都管用，但是如果没有人存活，那么就只能用一些数据做实验，然后从中学到一些东西。

问：下面讨论一些哲学问题。您说过，社会上的邪恶源于制度，而不是我们的本性，大多数人都是善良的，他们有善良的意图，但也有故意作恶的能力。这取决于他们的成长，取决于他们的环境么？

答：或许是源于我们的天性，实际上我们做的任何事情都源于我们的本性，制度也是人性表达的一种方式。

但据我们所知，人性可以产生许多不同的制度，但已经发展起来的那些结构与历史偶然性有关。制度对于我们的本性必不可少，像市场制度这样的东西只是我们本性的一部分，我们还有其他的一些制度。

古典自由主义的认为，只有自由才是我们的本能，是我们本性的核心，但是他的反面也是我们的本性，人性可以容纳这两种本质。

问：有没有一些记忆给你带来了快乐，然后你想再次体验？

答：当然。坠入爱河，有一些孩子。

问：您在语言学，认知学方面给世界做出了突出的贡献，重温你当时第一次想到那些概念的时候，会让你感到兴奋么？

答：兴奋。当你发现一些东西的时候，例如对结构依赖性的观察和解释，都是令人兴奋的。

在20世纪50年代，那时候语言被认为是一种外部的现象，一种思想之外的东西。很明显，这似乎是不合理的，就像我前面说的，你身上的东西决定了你说的是英文，而不是斯瓦希里语。

但不是真正的发现，而是一种观察，这有点像17世纪，那时候现代科学刚刚开始，科学家们愿意对看似显而易见的事情感到困惑。

例如，大家都认为一个沉重的铅球比一个轻的下降的更快，但是伽利略对此表示怀疑，并进行了实验。

在50年代，语言学也是这样的，愿意对一些从某种角度看似显而易见的现象感到迷惑不解。例如，结构语言学在当时几乎是官方的学说，把语言事实当作孤立的单位加以考察。事实上，生物学家对有机体也有类似的观点，当你观察每个人的时候是如此的不同，但你又能代表任何人。现在，我们都知道，上述与事实相距甚远：它们对于生物体，什么是语言有非常狭隘的限制。

对常识怀疑，这就是“询问”的本质。问：对人类来说，最特殊的事情就是死亡率，您是否在考虑死亡率的价值？

答：我自己对于死亡率不怎么在意，但我担心如果我的意识消失了，整个宇宙都会消失，那就非常可怕了。

问：你找到这个问题的答案了么？

答：没有人能够找到答案，但我不再被它所困扰。

问：在问一个荒谬的问题，您认为我们存在，我们在地球上生活有什么意义。

答：人类通过自己的活动已经回答了这个问题，没有普遍的答案。需要我们自己来确定有什么意义。

（雷锋网）