机器学习的一个方向:学会美的概念?

天天重磅,月月突破 之称的新智元,不久发表了一篇文章 【不在谷歌?没关系】不在大公司,如何做好深度学习 。这篇文章中这部分很有感触

有理由认为,将今天的人工智能与一般人类智能区隔开来的主要障碍之一,是低数据信息传输问题(low data information transfer problem)。
人类科学家能够从非常有限的信息中获得深远的见解。就像故事里说的,牛顿从一个苹果掉下来的事例中,得出行星运行的万有引力定理。这简直是 one-shot learning 的壮举! 以此看,物理本身就是低数据学习(low data learning)的一种极端形式,旨在从有限的数据点中提取一般原则。
在设计理论时,物理学家通常会依赖不朽(invariance)和美(aesthetics)。

从长期的经验来看,物理学家知道,科学理论往往满足一定的数学标准。
同样,我们也可以假设,能够泛化的学习算法必须利用世界上的隐藏结构。
作者希望,我们能够找到一种方法,教导学习系统理解美。
数学家、物理学家和科学家训练自己,在自然界的法则中感受到美的存在。能够从隐藏结构中学会欣赏这种美的算法可能十分重要,这种算法有一天或许能做出伟大的科学理论发现。

这些文字背后想表达的更深层的意思,让我想起了我很喜欢的一位 物理学家张首晟谈 过的另外一个词 品味 。他是这么说的

但是为什么最终有些人能够更上一层楼,这个决定性因素其实超出了物理学的知识范畴,就是需要具有一种品味,因为大家能力都很接近,都在竞争,前面都摆着比如十条路,然后我选择这条路,你选择另外一条。最后的结果一般只有一个人成功,而且往往从技术层面上说,最后成功的这个人并不一定那么厉害,他的成功是因为他选择了正确的方向。
所以从这个观点来看,其实科学和艺术非常相像,就是一种品味。这跟历史也比较像,就如同我们在紧要历史关头,到底要做什么样的决定。所以这些看得多了,对你在这个选择关头可能会有些帮助。可能这些选择看似偶然,其实是一个知识长期积累的结果。

如果一个程序有了一定程度的品味,那么它就能知道计算出来的东西,哪些是具有数学上的形式美的,哪些没有。

机器学习领域需要掌握自然科学家心目中的美感,而自然科学家心目中的美感来源于哲学(至少张首晟是这样)


后记:

我认为自然语言处理要达到的一个目标,就是能理解不同文章,词汇背后想要表达的情感,并总结成一种不依赖于人类书面文字的东西。是更加抽象,更加底层,更加本质的问题。

就像我读到新智元的文章时,能联想到张首晟说的*品味*。这种思维过程的掌握,如何教会程序?这可就不是通过海量的数据就能解决的了。或许,这方面的突破依赖于对于大脑研究的突破吧。

在王威廉的 《奇点理论:是关于人工智能的-科学理论?还是垃圾科学?》 一文中,引用一位教授的话,表达的也是同一个意思

引用卡内基梅隆大学计算机学院教授 爱德华·霍威的话 :“你们这些做研究的,机器分类的准确率再提高 1% 有什么用?我根本不关心。 我问你‘什么是语义’,你的程序能回答吗? 我问计算机程序一个简单问题,‘小明买了一辆车’,句子里的‘买’对于计算机来说到底是什么意思,应该怎么表述?”

机器学习很火,新闻上时常可以看见诸如 深度学习,大数据,人工智能。在我看来,都不过是利用已有的技术实现的拟合/分类。在这一波机器学期热潮的背后,那些本质的问题,依然同几十年前一样,等待着人们的回答。

答案,又会在什么时候揭晓?

写于2017年夏


2017-07-16 补充参考

我们要如何判断数学公式之美? 一文

无论美是什么,数学家都已经发现了抽象的数学里的美学价值。

数学到底是通过什么才让人感觉到它优雅和美丽呢:是内部逻辑?是简洁和强解释力的独特组合?或只是纯粹的智慧之美?

数学家似乎将简洁视为数学之美的重要属性

Comments
Write a Comment