我们认为机器教学问题处于教室式的环境中,教师必须向不同的学生群体提供相同的例子。他们的多样性源于他们初始内部状态的差异以及他们的学习率。我们证明了一位完全了解学生学习动态的教师可以使用O(min {d,N} log(1 / eps))示例向整个课堂教授目标概念,其中d是问题的环境维度,N是学习者的数量,eps是准确度参数。当教师对由嘈杂声提供的学习者内部动力学有一定的了解时,我们展示了我们教学策略的稳健性。此外,我们研究了学习者的工作量与教师目标概念教学成本之间的权衡。我们的实验验证了理论结果,并建议将课堂适当地划分为同质群体,从而在这两个目标之间取得平衡。
translated by 谷歌翻译
我们介绍了一种产生合成蛋白质序列的方法,该序列被预测为对某些抗生素具有抗性。我们使用预测对人体肠道区域的抗生素具有抗性的6,023个基因进行了这项研究,并作为输入输入到Wasserstein生成对抗网络(W-GAN)模型中,该模型是已知可有效执行的原始生成对抗模型的变体。当涉及模仿真实数据的分布以便生成与作为训练数据馈送的原始数据类似的新数据时
translated by 谷歌翻译
自然语言推理(NLI)的任务被广泛建模为监督权利对分类。虽然最近在单一文本上生成关于分类器预测的解释已经有很多工作,但是没有尝试生成对句子对操作的分类器的解释。在本文中,我们展示了可以为NLI生成令牌级别的解释,而无需为此目的明确地注释训练数据。我们使用简单的LSTM架构,并为此任务评估LIME和Anchor解释。我们将这些与使用阈值注意力量级预测的多实例学习(MIL)方法进行比较。我们在本文中提出的方法是对NLI的句子对进行零镜头单句标记的novelextension。我们在经过充分研究的SNLI数据集上进行实验,该数据集最近通过手动注释令牌来解释相关关系。我们发现我们的基于MIL的白盒方法虽然更快,但是达不到与黑盒方法相同的精度。
translated by 谷歌翻译
本文研究了一类受限制的不安定多臂匪徒。约束的形式是随时可用的武器。这种变化可以是随机的也可以是半确定的。可以选择在每个决策间隔中播放固定数量的范围。每个军队的游戏都依赖于州的奖励。通过来自所释放的臂的二进制反馈信号可以部分地观察到当前的武器状态。武器的当前可用性是完全可以观察到的。目标是最大限度地累积奖励。有关部分国家信息的军备未来可用性的不确定性使这一目标具有挑战性。使用Whittle的索引策略分析了这个优化问题。为此,研究了一个不受约束的不安分的单臂匪徒。它被证明可以接受阈值类型的最优策略,并且也是可索引的。提出了一种计算Whittle指数的算法。此外,为了估计各种解的次优性程度,推导了价值函数的上界。仿真研究比较了Whittle指数,修正的Wittle指数和近视指标的表现。
translated by 谷歌翻译
前景和沉积盆地演化模型的复杂且计算上昂贵的特征对于有效推理和优化方法的开发提出了重大挑战。贝叶斯推断提供了用于自由模型参数的估计和不确定性量化的方法。在我们之前的工作中,并行回火贝叶斯兰德被开发为景观和盆地演化模拟软件巴兰兹的参数估计和不确定性量化的框架。并行回火Bayeslands具有高性能计算功能,可并行运行数十个处理内核,以提高计算效率。尽管使用了并行计算,但由于需要绘制数千个样本并进行评估,因此该过程仍具有计算挑战性。在大规模景观和盆地演化问题中,单个模型评估可能需要几分钟到几小时,在某些情况下甚至几天。代理辅助优化已成功应用于许多工程问题。这促使其在优化和参考方法中的应用适用于地质学和地球物理学中的复杂模型。通过开发计算上廉价的代理来模拟昂贵的模型,可以加速并行回火贝叶斯兰德。在本文中,我们提出了代理辅助平行回火的应用,其中代理模仿包括侵蚀,沉积物运输和沉积在内的景观演化模型,通过估计模型给出的似然函数。我们使用机器学习模型作为代理,从并行调温算法生成的样本中学习。结果表明,该方法在保持解决方案质量的同时显着降低整体计算成本。
translated by 谷歌翻译
这项工作提出了一个远程操作的人形机器人系统,可以模仿人类的运动,走路和转弯。为了捕获人体运动,使用Microsoft KinectDepth传感器。与笨重的动作捕捉套装不同,传感器使系统更易于与之交互。骨架数据从Kinect中提取,Kinect被处理以生成机器人的关节角。机器人操作系统(ROS)用于代码的各个部分之间的通信,以实现最小的延迟。因此,机器人实时地模仿人类,并且可以忽略不计。与大多数人体运动模拟系统不同,该系统不是固定的。捕获并处理用户的下半身运动并用于使机器人向前,向后行走并使其向右或向左转动,从而实现完全动态的操作人形机器人系统。
translated by 谷歌翻译
在考虑用数据回答重要问题时,无监督数据提供了广泛的洞察机会和独特的挑战。本研究考虑了学生调查数据,其具体目标是将学生群体中的群体与识别不同贫困水平的基本概念聚类在一起。在数据清理和组织阶段考虑模糊逻辑,帮助创建逻辑因变量进行分析比较。使用多重数据减少技术,减少并清理了调查。最后,应用并比较多种聚类技术(k均值,k-模式和层次聚类)。虽然每种方法都有优势,但目标是确定哪种方法在应用于调查数据时最为可行,特别是在尝试识别最贫困的学生时。
translated by 谷歌翻译
在插槽填充范例中,用户可以在对话期间返回上下文中的插槽,上下文理解系统的目标是将引用表达式解析为上下文中的适当插槽。在本文中,我们构建了上下文中继系统〜\ citep {Naik2018ContextualSC},它提供了一个可扩展的多域框架来解析引用。然而,由于对目标语言中的注释数据的获取需求很大,因此将这种方法扩展为跨语言并不是一项微不足道的任务。我们主要关注用于参考分辨率的跨语言方法,以减轻对目标语言中注释数据的需求。在跨语言设置中,我们假设存在对注释资源的访问以及源语言中训练有素的模型以及目标语言中很少或没有注释数据。在本文中,我们探讨了三种不同的跨语言转移方法,如数据扩充,多语言嵌入和机器翻译。我们在低资源设置和大量资源设置上比较这些方法。我们的实验表明,通过数据增加实现多语言嵌入和远程化会对低资源设置产生重大影响,但随着目标语言中可用数据量的增加,收益会减少。此外,当与机器翻译结合使用时,我们可以获得与目标语言中的实际实时数据非常接近的性能,只有25%的数据投射到目标语言中。
translated by 谷歌翻译
We present the results of the first Fact Extraction and VERification (FEVER) Shared Task. The task challenged participants to classify whether human-written factoid claims could be SUPPORTED or REFUTED using evidence retrieved from Wikipedia. We received entries from 23 competing teams, 19 of which scored higher than the previously published base-line. The best performing system achieved a FEVER score of 64.21%. In this paper, we present the results of the shared task and a summary of the systems, highlighting com-monalities and innovations among participating systems.
translated by 谷歌翻译
并行回火解决了贝叶斯神经学习的规范马尔可夫链蒙特卡罗方法的一些缺点,具有利用高性能计算的能力。但是,由于网络参数和大数据的范围很大,因此仍存在一定的挑战。代理辅助优化考虑了模型的目标函数的估计,给出了计算效率低下或难以获得明确结果的模型。我们通过将并行计算特征与代理辅助估计似然函数相结合来描述模型参数值的合理性,给出具体的观察数据,从而增加了对大规模问题的并行回火的低效率。在本文中,我们提出替代辅助并行训练贝叶斯神经学习,其中使用代理人来估计可能性。通过替代物的估计变得有用,而不是评估具有大量参数和数据集的计算昂贵的模型。我们的结果表明,该方法显着降低了计算成本,同时保持了使用贝叶斯神经学习的质量优柔寡断。该方法适用于各种数值模型的贝叶斯反演和不确定性量化。
translated by 谷歌翻译