我们证明,可轻松获取行为的数字记录,例如Facebook Likes,可以自动区分各种高度微妙的个人特征,包括:生活满意度,文化种族,政治观点,年龄,性别和人格特征。该分析基于超过738,000名用户的数据集,他们为我们的扩展人格分析授予了他们的Facebook喜欢,社交网络活动,自我中心网络,人口统计特征以及各种心理测试的结果。所提出的模型使用Facebook Like对象之间的唯一映射技术到相应的Facebook页面类别/子类别对象,然后将其评估为用于一组机器学习算法的特征,以预测来自喜欢的个人心理 - 人口统计学概况。该模型在83%的情况下区分宗教和非宗教个体,在87%的情况下区分亚洲和欧洲,在81%的情况下区分情绪稳定和情绪不稳定。我们提供属性和喜欢之间相关性的示例,并提出未来方向的建议。
translated by 谷歌翻译
缺乏医生处方指南是美国目前阿片类药物流行的一个关键驱动因素。在这项工作中,我们分析了药物药物索赔数据,以了解最初合成阿片类药物后更容易出现不良后果的患者特征。为此,我们提出了一种生成模型,该模型允许从亚组的观察数据中发现,这些数据显示由于治疗而增加或减少的因果效应。我们的方法将子群作为混合分布进行建模,使用稀疏性来增强解释性,同时联合学习潜在结果的非线性预测因子以更好地调整混淆。该方法导致对已发现的子群的人类可解释的见解,提高决策支持的实用性
translated by 谷歌翻译
我们提出了最先进的自动语音识别(ASR)系统,采用标准的混合DNN \ / HMM架构,与LibriSpeech任务的基于解释的编码器 - 解码器设计相比。为系统架构提供了系统开发的详细描述,包括模型设计,预训练方案,训练计划和优化方法。混合DNN / HMM和基于注意力的系统都采用双向LSTM进行声学建模/编码。对于语言建模,我们使用LSTM和基于Transformer的架构。我们所有的系统都是使用RWTH开源工具包RASR和RETURNN构建的。根据作者的最佳知识,在完整的LibriSpeech培训集上进行培训时获得的结果是目前最好的,对于混合DNN / HMM和基于注意的系统而言。我们的单一混合系统甚至优于以前从八个单一系统组合中获得的结果。我们的比较显示,在LibriSpeech 960h任务中,混合DNN / HMM系统在干净度方面优于基于注意力的系统15%,在其他测试集上在字错误率方面优于40%。此外,LibriSpeech培训语料库中减少的100h子集的实验甚至在混合DNN / HMM和基于注意力的体系结构之间显示出更明显的差异。
translated by 谷歌翻译
我们提出了一种基于学习的多视图立体视觉(MVS)方法。虽然当前的深度MVS方法取得了令人瞩目的成果,但它们至关重要地依赖于地面真实的3D训练数据,并且获得这种精确的3D几何形状是一个主要的障碍。我们的框架反而利用多个视图之间的光度一致性作为广泛基线MVS设置中学习深度预测的监督信号。然而,由于跨视图的遮挡和光照变化,天真地应用光致一致性约束是不期望的。为了克服这个问题,我们提出了一个强大的损失公式:a)强制执行一阶一致性,b)对每个点,选择性地强制与某些视图保持一致,从而隐式处理遮挡。我们使用realdataset证明我们在没有3D监督的情况下学习MVS的能力,并表明我们提出的强大损失的每个组成部分都会带来显着的改进。我们定性地观察到我们的重建比获得的基本事实更完整,进一步显示了这种方法的优点。最后,我们的学习模型推广到新颖的设置,并且我们的方法允许通过无监督的微调来将现有CNN适应于没有地面真实3D的数据集。项目网页:https://tejaskhot.github.io/unsup_mvs
translated by 谷歌翻译
在本文中,我们提出了一个完全自主和内在动机的HRI实验机器人。我们认为,基于预测信息形式主义的内在动机方法,就像这里介绍的那样,可以为我们提供一条通向自动机器人行为生成的途径,它能够产生足够有趣的行为,以维持与人类的交互,而不需要循环中的人工操作员。我们提出了一种可能的反应性基线行为,用于未来研究的比较。参与者以不同的方式感知基线和适应性,内在动机的行为。在我们的探索性研究中,我们看到证据表明参与者认为内在动机的机器人对反应性基线行为的智能程度较低。我们认为这主要是由于选择的高适应率和环境设计。然而,我们还认为自适应机器人被认为更加温暖,这是一个在人际交往中比权限更重的因素。
translated by 谷歌翻译
照明在肖像照片中传达主体的本质和深度方面发挥着核心作用。专业摄影师将精心控制他们工作室的灯光,以操纵他们的主题,而消费摄影师通常会受到环境照明的限制。尽管先前的工作已经探索了重新照亮图像的技术,但是由于专用硬件的要求,受控或已知照明下的受试者的多个图像,或几何和反射的精确模型,它们的效用通常是有限的。为此,我们提出了一个用于肖像重新照明的系统:一个神经网络,它在无约束的环境中输入一个用标准手机摄像机拍摄的肖像的单个RGB图像,并从该图像产生该主体的重新映射,就好像它被照亮一样任何提供环境地图。我们的方法是在一个由18个人组成的小型数据库上进行训练,该数据库由不同的定向光源捕获,在受控的光照阶段,由密集采样的光球组成。与以前的工作相比,我们提出的技术在我们的数据集验证集上产生了定量优越的结果,并在数百个真实手机肖像的数据集中产生了令人信服的定性重新照明结果。因为ourtechnique可以在160毫秒内产生640美元以上640美元的图像,所以未来它可能会启用面向交互式用户的摄影应用程序。
translated by 谷歌翻译
在本文中,我们使用最先进的机器学习技术提供了基于眼周的预测(通常称为性别分类)的综合分析。为了反映更具挑战性的场景,其中可能从未知的源(即传感器)获得眼周图像,在由几个近红外(NIR)和可见波长(VW)图像数据库组成的融合集上训练卷积神经网络。在每个频谱内的交叉传感器场景中,实现了大约85%的平均分类精度。当跨谱进行性别预测时,获得约82%的平均分类准确度。最后,多光谱性别预测产生的平均分类准确度为83%。与提出的工作相比,获得的结果提供了更准确地估计从眼周区域预测受试者的xx的可行性。
translated by 谷歌翻译
计算哲学是机械化计算技术的运用,利用传统哲学方法难以或不可能找到的哲学见解。计算形而上学是计算哲学,侧重于形而上学。在本文中,我们(a)开发了模态形而上学的结果,其发现是计算机辅助的,并且(b)得出结论,这些结果不仅对哲学的明显好处起作用,而且对于计算机科学的益处也不那么明显,因为新的导致这些结果的计算技术可能在计算机科学中更广泛地应用。本文包括对背景方法及其演变方式的描述,以及对我们新结果的讨论。
translated by 谷歌翻译
对抗训练,其中网络训练对抗的例子,是抵御强烈攻击的对抗性攻击的少数防御之一。遗憾的是,产生强大对抗性示例的高成本使标准对抗性训练对像ImageNet这样的大规模问题不切实际。我们提出了一种算法,通过循环更新模型参数时计算的梯度信息,消除了生成对抗性示例的开销成本。与自然训练相比,我们的“免费”对抗训练算法在CIFAR-10和CIFAR-100数据集上具有最先进的稳健性,并且比其他强大的对抗训练方法快7到30倍。使用具有4个P100 GPU的单工作站和2天的运行时间,我们可以为大规模ImageNet分类任务训练一个强大的模型,该任务对PGD攻击保持40%的准确性。
translated by 谷歌翻译
来自近红外图像的大多数性别分类方法都使用了虹膜信息。最近的工作已经探索了整个眼周虹膜的使用,这令人惊讶地取得了更好的效果。这表明性别分类中最相关的信息并不位于虹膜中。在这项工作中,我们分析和演示了在眼周NIR图像中描述性别的最相关特征的位置,并评估影响其分类。实验表明,眼周区域比虹膜区域包含更多的性别信息。我们提取了几个特征(强度,纹理和形状),并使用XgBoost算法根据其相关性对它们进行分类。当使用最相关的特征时,支持向量机和九个集合分类器用于测试性别准确性。当使用位于眼周区域的4,000个特征时,获得最佳分类结果(89.22%)。进行了关于完整的眼周虹膜图像与虹膜闭塞图像的附加实验。获得的性别分类率分别为84.35%和85.75%。我们还通过新的数据库(UNAB-Gender)为最新技术做出贡献。从结果来看,我们建议只关注虹膜的周围区域。这使我们能够从NIR眼周图像中实现更快的性别分类。
translated by 谷歌翻译