深度学习系统正在改变我们理解和模拟大量过程的方法。其中一些应用就像电子游戏和医疗保健一样多样化。它也被证明是一种有助于澄清难以理解的具体过程的工具。麻省理工学院大脑、思维与机器中心(CBMM)和计算机科学与人工智能实验室(CSAIL)的一组研究人员已经建立了一项研究,试图回答这些围绕幼儿语言学习的问题。这个过程的增强称为语义解析。
这个过程包括将语言转换成逻辑的和可测量的数据形式。它采用深度学习算法,在儿童身上复制这个过程,通过观察获得结果。这项研究背后的团队将在今年11月2日至4日在比利时布鲁塞尔举行的自然语言处理经验方法会议上发表一篇论文,详细介绍相关细节。该团队使用视频进行训练以获得结果。这篇论文的第一作者,电气工程与计算机科学系和CSAIL的研究生Candace Ross说:“有时间成分——物体之间和人之间的互动——以及你在静态图像或语言中看不到的高级属性。”
总共使用了400个演示任务的视频,并添加了1200个字幕。“土耳其机械”(Mechanical Turk)是一个众包平台,帮助添加了文字说明。然后,科学家们将字幕分为两组。840个字幕用于调校和培训目的,其余360个字幕仅用于测试,并提供了一个精简的过程。该研究的合著者Andrei Barbu是计算机科学和人工智能实验室(CSAIL)和大脑、思维和机器中心(CBMM)的研究员,他说:“你几乎不需要那么多的数据——尽管如果你有(数据),你可以扩大到巨大的数据集。”
这项研究为加深对儿童参与的一些基本学习过程的理解提供了可能性。由于孩子们处于不同的发展阶段,他们在表达这些细微差别方面存在一些明显的挑战。人工智能在这方面发挥了重要作用。CSAIL首席研究科学家兼InfoLab集团负责人Boris Katz表示,“一个孩子可以通过不同的方式获得多余的、互补的信息,包括听到父母和兄弟姐妹谈论世界,以及触觉信息和视觉信息,(这有助于他或她)理解世界。处理所有这些同时进行的感官输入,真是个神奇的谜题。这项工作是理解这种学习是如何在世界上发生的更大的一部分。”
习得语言的过程是非常复杂的,它需要考虑到儿童所处的世界的多学科方法。罗斯进一步补充道,“孩子们在学习过程中与环境互动。我们的想法是建立一个模型,它也可以利用感知来学习。”关于这篇论文的细节也在他们的论文中分享,基于抽样规划的深度序列模型通过华盛顿大学计算机科学系。