内窥镜伪影是促进中空器官疾病的诊断和治疗的核心挑战。精确检测特定伪像,如像素饱和度,运动模糊,镜面反射,气泡和碎片,对于高质量的帧恢复至关重要,对于实现可靠的计算机辅助工具以改善患者护理至关重要。目前,由于视频帧中存在大量的多类伪像,目前大多数内窥镜检查视频尚未进行分析。通过内窥镜伪影检测(EAD 2019)的挑战,我们通过解决内窥镜框架伪影的准确识别和定位来解决这一关键瓶颈问题,从而能够对不可用的视频帧进行进一步的关键定量分析,例如镶嵌和3D重建,这对于提供改善的患者护理至关重要。本文总结了挑战任务,并描述了在EAD 2019挑战中建立的数据集和评估标准。
translated by 谷歌翻译
我们提出了一种学习嵌入式几次学习的方法,该方法适用于任何方式和任意数量的镜头(无镜头)。除了将类原型固定为样本嵌入的欧几里德平均值之外,我们允许它们生活在更高维度的空间(嵌入式类模型)中,并学习原型和模型参数。类表示函数是隐式定义的,它允许我们使用简单的恒定大小结构来处理每个类的可变数量的镜头。类嵌入包含度量学习,这有助于在不占用类表示空间的情况下添加新类。尽管一般而且没有调整到基准,但我们的方法在标准的少数基准数据集上实现了最先进的性能。
translated by 谷歌翻译
尽管最近在计算机视觉方面取得了进展,但由于缺乏标记的训练数据,卫星图像的细粒度解释仍然具有挑战性。为了克服这一局限性,我们通过将地理参考维基百科文章与其相应位置的卫星图像配对,构建了一个名为WikiSatNet的新数据集。然后,我们通过从图像中预测相应文章的属性,提出了两种策略来学习卫星图像的表示。利用这种新的多模态数据集,我们可以大幅减少人工注释标签的数量和下游任务所需的时间。在最近发布的fMoW数据集中,我们的预训练策略可以将预先训练的模型的性能提升高达4:5%的F1得分。
translated by 谷歌翻译
激活函数在卷积神经网络的训练中起着至关重要的作用。因此,开发高效和执行功能是深度学习社区中的一个关键问题。这些方法的关键是允许可靠的参数学习,避免消失梯度问题。这项工作的目标是提出使用几种不同的激活函数训练的卷积神经网络的集合。此外,这里首次提出了新的激活功能。我们的目标是在中小型生物医学数据集中提高卷积神经网络的性能。我们的结果清楚地表明,所提出的整体结构表现为使用标准ReLU asactivation函数训练的卷积神经网络。所提出的集合优于p值为0.01的每个测试的独立激活函数;为了获得可靠的性能比较,我们使用twowell已知的卷积神经网络:Vgg16和ResNet50,在10多个数据集中测试了我们的方法。使用的MATLAB代码将在https://github.com/LorisNanni上提供。
translated by 谷歌翻译
由于缺乏关于主要社会,环境和经济指标的数据缺乏,特别是在发展中国家,联合国可持续发展目标(SDG)的进展受到阻碍。例如,由于调查成本高,贫困数据 - 十七个可持续发展目标中的第一个 - 在撒哈拉以南非洲空间稀疏且不经常收集。在这里,我们提出了一种使用来自维基百科文章的开源,地理定位文本信息来估计社会经济指标的新方法。我们证明现代NLP技术可用于使用附近的地理定位维基百科文章来预测社区 - levelasset财富和教育成果。当与夜间卫星图像配对时,我们的方法优于所有先前发布的预测任务的基准,表明维基百科的潜力可以为两个研究提供信息。社会科学和未来的政策决定。
translated by 谷歌翻译
全世界有数百万人缺席他们国家的人口普查。准确,现有和细化的人口指标对于改善政府资源配置,衡量疾病控制,应对自然灾害以及研究这些社区人类生活的任何方面至关重要。卫星图像可以提供足够的信息来建立人口普查地图,而无需政府人口普查的成本和时间。我们提出了两种卷积神经网络(CNN)架构,它可以有效地组合来自多个源的卫星图像输入,以准确地预测一个区域的人口密度。在本文中,我们使用来自印度农村的卫星图像和2011年SECC人口普查的人口标签。我们的最佳模型比以前的纸张以及LandScan(全球人口分布的社区标准)实现了更好的性能。
translated by 谷歌翻译
在本文中,我们提出了一系列关键的分界线,在讨论当前人工智能研究和应用的伦理和社会问题时尤为重要。正确区分与人工智能和弱AI相关的问题和关注点,在符号和连接AI之间,AI方法,数据和应用程序是进行知情辩论的先决条件。这种划分不仅有助于就当前人工智能技术和研究的道德操守进行急需的讨论。此外,充分建立这种划分还将加强知识共享,并支持技术和社会科学之间跨学科研究的严谨性。
translated by 谷歌翻译
移动电话等分布式设备可以生成和存储大量数据,从而增强机器学习模型;但是,此数据可能包含特定于数据所有者的私人信息,以防止数据的发布。我们希望在保持有用信息的同时减少用户特定的私人信息和数据之间的相关性。 Ratherthan学习了一个大型模型以实现端到端的私有化,我们引入了潜在表示的创建和数据私有化的解耦,允许用户特定的私有化在分布式设置中进行,计算量有限,对数据的有效性影响最小。我们利用变分自动编码器(VAE)来创建数据的紧凑潜在表示;然而,VAE仍然是固定的设备和所有可能的私人标签。然后,我们训练一个小的生成过滤器,根据私人和公用事业信息的个人偏好扰乱潜在的表示。通过使用可以在分布式设备上进行的GAN类型稳健优化来训练小型过滤器。我们对三个流行的数据集进行了实验:MNIST,UCI-Adult和CelebA,并进行全面的评估,包括可视化潜在嵌入的几何,并估计经验互信息,以显示我们的方法的有效性。
translated by 谷歌翻译
在这项工作中,提出了一个进化艺术项目,其中图像区域通过不同类型的透明,重叠和几何形状(例如,多边形,圆形,线条)进行近似。表示几何形状的特征和顺序的基因型利用适应度函数进化,该适应度函数具有输入图像的相应像素作为目标目标。因此,将基因型 - 表型作图应用于渲染图像,因为选择的遗传表示是间接的,即基因型不包括像素,而是形状与其性质的组合。形状,形状数量,突变类型和种群的不同组合进行了测试。这里的工作目标有两个:(1)用进化的间接编码尽可能精确地近似图像,(2)产生视觉上吸引人的结果和新颖的艺术风格。
translated by 谷歌翻译
相机型号识别是指将图片链接到用于拍摄它的相机模型的问题。由于这可能是在不同的法律申请中挑选可能的嫌疑人(例如,检测虐待儿童或恐怖主义宣传材料的作者)的一个促成因素,因此在文献中已经开发了许多准确的相机模型归属方法。然而,它们的主要缺点之一是问题的典型闭集假设。这意味着调查的照片总是被分配给在调查期间存在的一组已知的照相机模型中,即训练时间,以及照片的事实。在实际测试期间,通常可以忽略来自完全不相关的相机模型。在现实条件下,不可能假设所分析的每张图片都属于可用的相机型号之一。为了解决这个问题,在本文中,我们首次深入研究了在开放场景中解决相机模型识别问题的可能性。鉴于照片,我们的目标是检测它是来自一个已知的相关模型或来自未知设备。我们比较了不同的特征提取算法和特别针对开放集识别的分类器。我们还评估了可以与任何开放式分类器一起应用的可能的开放式训练协议。更具体地说,我们评估了一个针对具有深层特征的开集分类器的训练协议。我们观察到,较简单版本的训练协议与需要相似数据的结果类似,其结果可用于许多使用深度特征的应用程序。对独立数据集进行彻底测试表明,最近提出的卷积神经网络可以作为功能提取器,并且配备了经过适当训练的开放式分类器......
translated by 谷歌翻译