在处理了人类进行四子棋、五子棋、国际象棋等比赛视频剪辑的过程中,其中包括比赛胜利、平局和那些结果未知的比赛视频,计算机系统会借助视觉辨认系统识别棋盘、棋子和导致每一种结果的不同走法。随后一个独特的公式会让系统来检测所有可行的移动,并且借助从所有可能的结果所收集到的数据来计算最合适的移动。
巴黎第七大学的卢卡斯-凯撒在留意到我们知识领域中的一个巨大空白之后开发了一种学习算法,他发现物体认知机器学习试验相当的流行,尽管未来在自主机器人的创造上有着足够多的用法,然而研究高级复杂的计算机学习的并不多见。凯撒决定使用游戏作为一种初级的学习工具,因为它们是许多真实世界中相互作用场景的一种自然模型,在更广阔的环境当中会使结果变得更有意义。
凯撒使用一台内存只有4GB的笔记本电脑和一个单一的处理器核心作为他首次的测试项目,他解决了阻碍之前计算机学习试验的主要问题,将知识假设为归纳逻辑程序设计(ILP)。用于游戏学习的归纳逻辑程序设计的一个典型案例就是Progol,这个程序需要视觉线索和背景知识来学习简单的游戏。对于策略类游戏比如说四子棋和五子棋,凯撒推断需要更细腻的逻辑系统。
他放弃了最初的单一公式并且使用能够识别桌面游戏的行、列和对角线的相关结构,而且使用了7种不同的逻辑系统,从每个逻辑系统收集到的数据能够设计出一种调整后的公式。一个新增加的普通游戏比赛程序帮助计算机系统学习如何使用策略、学习合法的移动以及如何获得最后的胜利。
论文中写到:“这种组合让它在我们进行的试验中形成很短而且直观的公式,而且有确凿的理论证据表明它会出现另外的问题。”凯撒计划改编系统来解决这些问题,比如需要分级、结构学习或者一种概率公式的形式,所有的这些问题都将迟早出现在自主智能机器人的研发过程中。