使用社交账号登陆

当前位置: 主页 > 前沿 > 信息 • 能源

相比传统算法,人工智能分辨纽结快了20倍!

时间: 2020年07月30日 | 作者: 香港城大研创 | 来源: 香港城大研创
早前有研究团队首次成功训练人工神经网络分辨结的种类,准确度更超过99%,证明机器学习可以用于与纽结相关的数学及物理科学研究上。


还记得击败中国和韩国两个世界冠军棋王的人工智能系统 AlphaGo 吗?人脑与电脑的数场巔峰围棋对决,可谓人工智能的重要里程碑。AlphaGo背后所使用的是一种名为神经网络(Neural Network)的机器学习技术。

 

团队研究的结果早前于国际期刊 Physical Review E 上发表,题为“Identifying knot types of polymer conformations by machine learning”,及后更获《自然》杂志的“Research Highlights”专栏介绍。



未解的结:数学和物理学范畴的纽结分类


不同领域的科学家关心“结”的不同性质,例如有生物物理学家发现,蛋白质上的结会使其结构绷紧从而实现特殊的生物催化功能。DNA 的 “结” 会妨碍复制、转录以及细胞分裂,因此需要一种名为拓扑异构酶的生物酶来 “解结” 。另外,DNA 上的 “结” 可以减慢 DNA 通过纳米孔时的易位速度,从而促进了纳米孔测序(nanopore sequencing,一种 DNA 测序方法)技术的发展。有数学家则研究纽结理论(Knot theory),当中所谓的纽结,可以理解为打结之后再把绳子两端黏合,令绳结变成一个封闭的环。无论绳子如何变形,绳子上的纽结都保持不变。

 

数十年来,研究纽结理论的数学家一直关注如何辨别到底两个结是否属于同一类型,简而言之是可否在不切断绳子的情况下,将一个结转换成另一个结。数学家尚未找到辨别所有纽结的方法,而对于较为简单的纽结,数学家现时使用算法进行辨别,不过效率很慢,而且如果绳结愈复杂,需要的运算步骤就会大增。

 

当人工智能透过机器学习不断追上人脑,在图像辨识以至下棋方面已可媲美甚至胜过人类,究竟机器学习是否也能解决其他类型的问题呢?负责带领这次研究的香港城市大学物理学系助理教授代亮博士,就尝试测试人工神经网络能否解开纽结这个数学难题。他说:“纽结分类(knot classification)是数学和物理科学中一个重要但尚未解开的谜团,人工神经网络可能会提供新的见解。”




“教导”人工神经网络分辨纽结  人工智能系统是怎么学习的呢?


原来它们可以通过数据处理的任务接受训练,并且在训练过程中通过调整反馈讯号进行学习。而其中一种学习方式是深度学习(deep learning),即通过分层处理,将大量无序的讯号转为有用的资讯,并解决问题。这些一层层的数据编码模型(layered data-encoding models)就是人工神经网络。代博士进一步解释说:“神经网络亦可以理解为模拟人类大脑各神经元之间的连接。Google 开发的人工智能围棋程式‘AlphaGo’也是应用了相关技术。”

 

代博士的研究团队先由他们选定的五种结的类型,模拟出数百万个纽结样本。这些纽结非常复杂,一般无法凭肉眼辨别。团队就这项研究设计出两种神经网络模型,分别是前馈神经网络(Feed-forward neural network)和循环神经网络(Recurrent neural network),训练它们分辨上述五款已知分类的纽结样本。


image.png

研究团队选定了上述五种结类型,上面一行是结的原型,下面一行是研究团队用电脑模拟出来的纽结样本,供神经网络模型去分辨。这些纽结非常复杂,一般难以凭肉眼辨别。(图片来源:DOI: 10.1103/PhysRevE.101.022502)

 



卓有成效:善用循环神经网络分层的双向模式


代博士说:“运用神经网络模型去分辨纽结,比传统算法快 20 倍。而且神经网络还‘学有所成’,能够预测出没有见于训练时的纽结是属于哪一种。”研究人员将经过训练的两个模型应用于识别一百万个新模拟的纽结样本,当中前馈神经网络的准确度大约有七成,而循环神经网络的表现明显更胜一筹,估算的准确度高达约 99.5%。

 

研究人员认为这归功于循环神经网络分层採用的双向模式:讯息会在分层之间以及在分层之内向前向后地传递,能够更有效地利用序列信息,而且循环神经网络的长短期记忆(Long Short-Term Memory, LSTM)结构会过滤没有用途的讯息,从而更有效地进行预测。另外,研究人员亦发现,神经网络用以训练的数据样本愈多,分辨的准确度就愈高。


image.png

研究结果显示循环神经网络的表现更佳。图a 显示前馈神经网络估算五种纽结的准确度在 67.6% 至 75.3% 之间;而图b 显示循环神经网络的准确度始终保持在 99% 以上。(图片来源:DOI: 10.1103/PhysRevE.101.022502)

 

“这项研究证明了对于纽结这种独特且复杂的问题,神经网络也是一种有效的工具,能够抓住纽结的内在规律,从而达到非常高的纽结识别率。我们希望人工智能作为一种较新的工具,能够为数学和物理科学中一些重要问题提供新的视角并找出解决方案。”代博士总结说。

 

代博士是论文的通讯作者。论文的共同第一作者包括香港城大物理学系的研究助理 Olafs Vandans 和来自新加坡国立大学的研究助理杨凯元。香港中文大学数学系副教授吴忠涛也是该论文的共同作者。


这项研究得到香港城大、香港研究资助局、广东省基础与应用基础研究专项资金和国家自然科学基金的支持。

 

DOI: 10.1103/PhysRevE.101.022502