随着社交网络的普及及其对仇恨言论的不幸使用,对后者的自动检测已成为一个迫切的问题。在本文中,我们从先前的工作中再现了七种最先进的仇恨语音检测模型,并表明它们只有在经过相同类型的数据训练时才能表现良好。基于这些结果,我们认为对于成功的hatespeech检测,模型体系结构不如数据类型和标签标准重要。我们进一步表明,所有提出的检测技术都可以对抗那些可以(自动)插入拼写错误,更改字符边界或在原始仇恨言论中添加无害字词的对手。这些方法的组合对Google Perspective来说也是有效的 - 来自行业的尖端解决方案。我们的实验证明,对抗训练并不能完全缓解攻击,使用特征级功能可以使模型在使用单词级特征时更具系统攻击力。
translated by 谷歌翻译
自动生成的虚假餐厅评论对在线评论系统构成威胁。最近的研究表明,用户在检测隐藏在真实餐馆评论中的机器生成的虚假评论方面存在困难。这项工作中的方法(char-LSTM)有一个缺点:它难以保持不足,即当它产生对特定目标实体的评论时,所得到的评论可能包含与目标无关的短语,从而增加其可检测性。在这项工作中,我们提出并评估一种基于神经机器翻译(NMT)的更复杂的技术,我们可以用它来生成关于主题的评论。我们在Amazon Mechanical Turk上使用母语为英语的人员测试了多种ourtechnique变体。我们证明最佳变体产生的评论几乎具有最佳的可检测性(类别平均F分数为47%)。我们与持怀疑态度的用户进行用户研究,并表明我们的方法更频繁地逃避检测,与具有统计意义的最新技术(平均逃避3.2 / 4 vs 1.5 / 4)相比,在{\ alpha} = 1%(部分) 4.3)。我们开发了非常有效的检测工具,并在分类时达到平均F值97%。尽管虚假评论在愚弄人们方面非常有效,但有效的自动检测仍然是可行的。
translated by 谷歌翻译
实际项目调度通常需要在选择和替代生产活动的确切长度方面具有灵活性。此外,在许多生产计划应用中,必须同时安排多个批次。为了满足这些要求,引入了一个新的灵活资源约束的多项目调度问题,其中两个决策(活动选择灵活性和时间灵活性)被集成。除最小化完工时间外,还提出了两个由asteel行业应用案例启发的替代目标:最大化所选活动的平衡时间(时间平衡)和均衡资源利用(资源平衡)的最大化。针对已开发的集成柔性项目调度问题,提出了新的混合整数和约束规划(CP)模型。通过使用IBMILOG CPLEX的CP Optimizer解决大型钢铁行业实例,可以显示建议的CP模型的实际适用性。此外,灵活的资源约束项目调度问题(RCPSP)的基准实例被解决为最优。
translated by 谷歌翻译
使用无干3D超声(US)进行心导管检查的快速准确的导管检测可以提高干预的效率和结果。然而,美国的低图像质量需要额外的训练forsonographers定位导管。在本文中,我们提出了一种基于预先训练的VGG网络的导管检测方法,该方法通过重新组织的横截面利用3D信息通过共同完全卷积网络(FCN)对导管进行分割,FCN称为方向融合FCN( DF-FCN)。基于DF-FCN的分割图像,可以通过模型拟合来定位导管。我们的实验表明,所提出的方法可以成功地在具有挑战性的离体3D USdataset中检测消融导管,该数据在猪心脏上收集。大量分析表明,与最先进的仪器检测方法相比,所提方法的Dice得分为57.7%,至少提高了11.8%。由于DF-FCN的分割性能得到改善,导管可以定位,误差仅为1.4 mm。
translated by 谷歌翻译
精准医学领域旨在以可重复的方式基于患者特定因素定制治疗。为此,估计基于患者特征推荐治疗决策以最大化预定结果的平均值的最优个体化治疗方案(ITR)是特别令人感兴趣的。已经提出了几种方法用于从并行组设置中的临床试验数据估计最佳ITR,其中每个受试者被随机化为单一干预。然而,在从交叉研究设计估计最佳ITR的领域中已经做了很少的工作。这样的设计自然而然地为自己提供了精密医学,因为它们允许观察每个患者对多种治疗的反应。在本文中,我们介绍了一种使用来自2x2交叉研究的数据来预测最佳ITR的方法,该研究具有或没有遗留效应。提出的方法类似于政策检索方法,如结果加权学习;然而,我们利用交叉设计,利用每次治疗下的反应差异作为观察到的奖励。我们建立Fisher和全球一致性,进行数值实验,并分析来自饲养试验的数据,以证明与平行研究设计的标准方法相比,所提出的方法的改进性能。
translated by 谷歌翻译
主题模型在自然语言处理及其他方面得到广泛应用。在这里,我们提出了一种新的框架,用于评估基于合成语料库的概率主题建模算法,该合成语料库包含明确定义的地面真实主题结构。我们的方法的主要创新是通过比较标记级别的指定主题标签来量化种植和推断的主题结构之间的一致性的能力。在实验中,我们的方法产生关于主题模型的相对强度的新颖见解,因为语料库特征变化,当种植结构薄弱时,主题模型的第一个证据是“不可检测的阶段”。我们还通过预测真实世界语料库中主题建模算法分类任务的性能,确定了对合成公司获得的见解的实际相关性。
translated by 谷歌翻译
形状的分类在从医学成像到计算机视觉等各个领域中具有极大的兴趣。虽然已经为分类问题开发了许多统计框架,但大多数都与问题的早期表述密切相关 - 在一个相对低维的欧几里德空间中被描述为向量的对象被分类。统计形状数据有两个主要特性,表明需要采用新颖的方法:(i)形状本身具有无限维度,附近点的位置之间具有很强的依赖性,(ii)形状空间不是欧氏,而是基本上是弯曲的。为了适应数据的这些特征,我们使用曲线的平方根速度函数来提供形状的有用的形式描述,传递到不同投影点处的形状流形的切线空间,这有效地分离训练数据中的空间分类的形状。 ,并在这些切线空间内使用主成分来减少维数。我们用一种组合成对分类器的新方法来说明投影点和子空间选择对误分类率的影响。
translated by 谷歌翻译
大型标记数据集驱动了深度学习方法,以在各种医学成像任务上实现卓越的性能。我们提供了CheXpert,这是一个包含224,316张胸片的65,240名患者的大型数据集。我们设计了一个贴标机,可以自动检测放射学报告中14个观测值的存在,捕捉射线照相解释中固有的不确定性。我们研究了使用不确定性标签训练卷积神经网络的不同方法,这些方法根据可用的正面和横向射线照片输出这些观察的可能性。在由2名经过委员会认证的放射科医师手动注释的200个胸部放射学研究的验证集中,我们发现不同的不确定性方法对于不同的病理学是有用的。然后,我们评估了由500名胸部放射学研究组成的测试集上的最佳模型,该研究由5位经过委员会认证的放射科医师的共识进行注释,并将我们的模型与3位额外放射科医师在5种选定病理检测中的表现进行比较。在Cardiomegaly,Edema和Pleural Effusion上,模型ROC和PR曲线位于所有3个放射科医师手术点之上。将数据集作为标准基准向公众发布,以评估胸部X光片解释模型的性能。该数据集可从以下网站免费获取://stanfordmlgroup.github.io/competitions/chexpert。
translated by 谷歌翻译
因子图缩减范式(FGrn)中的贝叶斯网络是实现推理图的强大范例。不幸的是,这些网络的计算和内存成本可能相当大,即使是相对较小的网络,这也是这些结构在实践中经常被充分利用的主要原因之一。在这项工作中,通过详细的算法和结构分析,提出了各种降低成本的解决方案。还分析了经典批量学习算法的在线版本,显示了非常相似的结果(在无监督的上下文中);即使要建造多层结构,这也是必不可少的。提出的解决方案以及可能的在线学习算法包含在C ++库中,该库非常有效,特别是与直接使用众所周知的和积和最大似然(ML)算法相比。结果将特别参考LatentVariable Model(LVM)结构进行讨论。
translated by 谷歌翻译
双边和非本地均值过滤器是基于内核的过滤器的实例,其通常用于图像处理。最近表明,可以使用核矩阵的低秩近似来执行灰度图像的快速且准确的双边滤波。更具体地,基于核矩阵的特征分解,使用空间卷积对整体滤波进行近似,对于该空间卷积,可以使用有效的算法。不幸的是,这种技术无法扩展到高维数据,如颜色和高光谱图像。这仅仅是因为需要计算/存储大矩阵并在此情况下执行其特征分解。我们展示了如何使用Nystr \“om方法解决这个问题,这种方法通常用于近似大矩阵的特征分解。所得算法也可用于非局部均值滤波。我们证明了我们的双边和非局部均值滤波方法的有效性。特别是,我们的方法与最先进的快速算法相比具有竞争力,而且它具有对近似误差的理论保证。
translated by 谷歌翻译