计算哲学是机械化计算技术的运用,利用传统哲学方法难以或不可能找到的哲学见解。计算形而上学是计算哲学,侧重于形而上学。在本文中,我们(a)开发了模态形而上学的结果,其发现是计算机辅助的,并且(b)得出结论,这些结果不仅对哲学的明显好处起作用,而且对于计算机科学的益处也不那么明显,因为新的导致这些结果的计算技术可能在计算机科学中更广泛地应用。本文包括对背景方法及其演变方式的描述,以及对我们新结果的讨论。
translated by 谷歌翻译
正式道德领域正在经历从独特或标准方法到规范推理的转变,例如所谓的标准化学,以及各种特定应用理论。然而,正如义务,许可,禁止和道德承诺这样的规范性概念的充分处理是具有挑战性的,正如臭名昭着的道德逻辑悖论所说明的那样。在本文中,我们介绍了一种设计和评估规范推理理论的方法。特别是,我们提出了一个基于高阶逻辑的正式框架,一个设计方法,并讨论了工具支持。此外,我们使用一个实现的例子说明了这个方法,我们演示了使用它的不同方法,并讨论了如何设计现在,非专业用户和开发人员可以访问规范理论。
translated by 谷歌翻译
从一个幺半群的标准公理的推广开始,我们呈现了类别理论的各种相互等同的基础公理系统的逐步发展。我们的公理集已经在Isabelle / HOL交互式证明助手中形式化,这种形式化利用了自由逻辑在经典高阶逻辑中的语义正确嵌入。我们的公理集的建模和形式分析得到了一系列自动推理实验的显着支持。与Isabelle / HOL集成的工具。我们还讨论了我们的公理系统与文献中的替代提议的关系,包括由弗雷德和斯韦罗夫提出的公理集,我们揭示了一个技术问题(当在自由变量中编码,其中自由变量超出定义和未定义的对象时):eitherall operations,例如:形态构成,是总或它们的公理系统是不一致的。但是,修复此问题非常简单。
translated by 谷歌翻译
我们提出了最先进的自动语音识别(ASR)系统,采用标准的混合DNN \ / HMM架构,与LibriSpeech任务的基于解释的编码器 - 解码器设计相比。为系统架构提供了系统开发的详细描述,包括模型设计,预训练方案,训练计划和优化方法。混合DNN / HMM和基于注意力的系统都采用双向LSTM进行声学建模/编码。对于语言建模,我们使用LSTM和基于Transformer的架构。我们所有的系统都是使用RWTH开源工具包RASR和RETURNN构建的。根据作者的最佳知识,在完整的LibriSpeech培训集上进行培训时获得的结果是目前最好的,对于混合DNN / HMM和基于注意的系统而言。我们的单一混合系统甚至优于以前从八个单一系统组合中获得的结果。我们的比较显示,在LibriSpeech 960h任务中,混合DNN / HMM系统在干净度方面优于基于注意力的系统15%,在其他测试集上在字错误率方面优于40%。此外,LibriSpeech培训语料库中减少的100h子集的实验甚至在混合DNN / HMM和基于注意力的体系结构之间显示出更明显的差异。
translated by 谷歌翻译
我们提出了一种基于学习的多视图立体视觉(MVS)方法。虽然当前的深度MVS方法取得了令人瞩目的成果,但它们至关重要地依赖于地面真实的3D训练数据,并且获得这种精确的3D几何形状是一个主要的障碍。我们的框架反而利用多个视图之间的光度一致性作为广泛基线MVS设置中学习深度预测的监督信号。然而,由于跨视图的遮挡和光照变化,天真地应用光致一致性约束是不期望的。为了克服这个问题,我们提出了一个强大的损失公式:a)强制执行一阶一致性,b)对每个点,选择性地强制与某些视图保持一致,从而隐式处理遮挡。我们使用realdataset证明我们在没有3D监督的情况下学习MVS的能力,并表明我们提出的强大损失的每个组成部分都会带来显着的改进。我们定性地观察到我们的重建比获得的基本事实更完整,进一步显示了这种方法的优点。最后,我们的学习模型推广到新颖的设置,并且我们的方法允许通过无监督的微调来将现有CNN适应于没有地面真实3D的数据集。项目网页:https://tejaskhot.github.io/unsup_mvs
translated by 谷歌翻译
在本文中,我们提出了一个完全自主和内在动机的HRI实验机器人。我们认为,基于预测信息形式主义的内在动机方法,就像这里介绍的那样,可以为我们提供一条通向自动机器人行为生成的途径,它能够产生足够有趣的行为,以维持与人类的交互,而不需要循环中的人工操作员。我们提出了一种可能的反应性基线行为,用于未来研究的比较。参与者以不同的方式感知基线和适应性,内在动机的行为。在我们的探索性研究中,我们看到证据表明参与者认为内在动机的机器人对反应性基线行为的智能程度较低。我们认为这主要是由于选择的高适应率和环境设计。然而,我们还认为自适应机器人被认为更加温暖,这是一个在人际交往中比权限更重的因素。
translated by 谷歌翻译
照明在肖像照片中传达主体的本质和深度方面发挥着核心作用。专业摄影师将精心控制他们工作室的灯光,以操纵他们的主题,而消费摄影师通常会受到环境照明的限制。尽管先前的工作已经探索了重新照亮图像的技术,但是由于专用硬件的要求,受控或已知照明下的受试者的多个图像,或几何和反射的精确模型,它们的效用通常是有限的。为此,我们提出了一个用于肖像重新照明的系统:一个神经网络,它在无约束的环境中输入一个用标准手机摄像机拍摄的肖像的单个RGB图像,并从该图像产生该主体的重新映射,就好像它被照亮一样任何提供环境地图。我们的方法是在一个由18个人组成的小型数据库上进行训练,该数据库由不同的定向光源捕获,在受控的光照阶段,由密集采样的光球组成。与以前的工作相比,我们提出的技术在我们的数据集验证集上产生了定量优越的结果,并在数百个真实手机肖像的数据集中产生了令人信服的定性重新照明结果。因为ourtechnique可以在160毫秒内产生640美元以上640美元的图像,所以未来它可能会启用面向交互式用户的摄影应用程序。
translated by 谷歌翻译
在本文中,我们使用最先进的机器学习技术提供了基于眼周的预测(通常称为性别分类)的综合分析。为了反映更具挑战性的场景,其中可能从未知的源(即传感器)获得眼周图像,在由几个近红外(NIR)和可见波长(VW)图像数据库组成的融合集上训练卷积神经网络。在每个频谱内的交叉传感器场景中,实现了大约85%的平均分类精度。当跨谱进行性别预测时,获得约82%的平均分类准确度。最后,多光谱性别预测产生的平均分类准确度为83%。与提出的工作相比,获得的结果提供了更准确地估计从眼周区域预测受试者的xx的可行性。
translated by 谷歌翻译
对抗训练,其中网络训练对抗的例子,是抵御强烈攻击的对抗性攻击的少数防御之一。遗憾的是,产生强大对抗性示例的高成本使标准对抗性训练对像ImageNet这样的大规模问题不切实际。我们提出了一种算法,通过循环更新模型参数时计算的梯度信息,消除了生成对抗性示例的开销成本。与自然训练相比,我们的“免费”对抗训练算法在CIFAR-10和CIFAR-100数据集上具有最先进的稳健性,并且比其他强大的对抗训练方法快7到30倍。使用具有4个P100 GPU的单工作站和2天的运行时间,我们可以为大规模ImageNet分类任务训练一个强大的模型,该任务对PGD攻击保持40%的准确性。
translated by 谷歌翻译
来自近红外图像的大多数性别分类方法都使用了虹膜信息。最近的工作已经探索了整个眼周虹膜的使用,这令人惊讶地取得了更好的效果。这表明性别分类中最相关的信息并不位于虹膜中。在这项工作中,我们分析和演示了在眼周NIR图像中描述性别的最相关特征的位置,并评估影响其分类。实验表明,眼周区域比虹膜区域包含更多的性别信息。我们提取了几个特征(强度,纹理和形状),并使用XgBoost算法根据其相关性对它们进行分类。当使用最相关的特征时,支持向量机和九个集合分类器用于测试性别准确性。当使用位于眼周区域的4,000个特征时,获得最佳分类结果(89.22%)。进行了关于完整的眼周虹膜图像与虹膜闭塞图像的附加实验。获得的性别分类率分别为84.35%和85.75%。我们还通过新的数据库(UNAB-Gender)为最新技术做出贡献。从结果来看,我们建议只关注虹膜的周围区域。这使我们能够从NIR眼周图像中实现更快的性别分类。
translated by 谷歌翻译