卷积神经网络中的大多数研究都集中在增加网络深度以提高准确性,导致大量参数将受过训练的网络限制在具有内存和处理约束的平台上。我们建议修改Very DeepConvolutional神经网络(VDCNN)模型的结构,以适应移动平台约束并保持性能。在本文中,我们评估了TemporalDepthwise可分离卷积和全局平均池在网络参数,存储大小和延迟方面的影响。压缩模型(SVDCNN)的尺寸在10倍到20倍之间,具体取决于网络深度,最大尺寸为6MB。关于准确性,与基线模型相比,网络经历0.4%至1.3%的损失并获得较低的延迟。
translated by 谷歌翻译
Item Response Theory (IRT) aims to assess latent abilities of respondents based on the correctness of their answers in aptitude test items with different difficulty levels. In this paper, we propose the β 3-IRT model, which models continuous responses and can generate a much enriched family of Item Characteristic Curves. In experiments we applied the proposed model to data from an online exam platform, and show our model outperforms a more standard 2PL-ND model on all datasets. Furthermore, we show how to apply β 3-IRT to assess the ability of machine learning classifiers. This novel application results in a new metric for evaluating the quality of the classifier's probability estimates, based on the inferred difficulty and discrimination of data instances.
translated by 谷歌翻译
In this paper, multiple instance learning (MIL) algorithms to automatically perform root detection and segmen-tation in minirhizotron imagery using only image-level labels are proposed. Root and soil characteristics vary from location to location, thus, supervised machine learning approaches that are trained with local data provide the best ability to identify and segment roots in minirhizotron imagery. However, labeling roots for training data (or otherwise) is an extremely tedious and time-consuming task. This paper aims to address this problem by labeling data at the image level (rather than the individual root or root pixel level) and train algorithms to perform individual root pixel level segmentation using MIL strategies. Three MIL methods (MI-ACE, miSVM, MIForests) were applied to root detection and compared to non-MIL approches. The results show that MIL methods improve root segmentation in challenging minirhizotron imagery and reduce the labeling burden. In our results, miSVM outperformed other methods. The MI-ACE algorithm was a close second with an added advantage that it learned an interpretable root signature which identified the traits used to distinguish roots from soil and did not require parameter selection. Note to Practitioners-Minirhizotrons provide an efficient and non-destructive way to collect plant roots for studying root system dynamically. However existing software used to extract roots from minirhizotron image require significant, tedious manual marking of roots and soil in the collected imagery. Due to this slow manual process, the ability to collect useful information from a large number of minirhizotron images is bottlenecked. In this paper, we propose an automated approach to segment roots from minirhizotron images. The proposed methods not only automatically identifies and segments root pixels in imagery, but also allow for an efficient approach to label training data. This allows one to be able to retrain the models for adaptation to new environments and soil conditions. The methods we proposed in the paper only require one to label each training image as having roots or not (as opposed to labeling individual pixels).
translated by 谷歌翻译
我们发展了遗传编程二叉树的浮点Sextic多项式群体达数百万代。具有近四亿条指令的程序由交叉创建。为了支持无限制的长期演进实验LTEE GP,我们使用SIMD并行AVX 512位指令和48个线程,在单个Intel Xeon Gold 6126 2.60GHz服务器上产生高达1390亿GP操作的​​性能,139 giga GPops。
translated by 谷歌翻译
我们解决了从单个RGB图像自动重建场景的完整3D模型的问题。这项具有挑战性的任务需要推断出可见和遮挡表面的形状。我们的方法利用以观察者为中心的多层表示场景几何图形,从最近的方法改编为单个对象形状完成。为了提高复杂场景的以视图为中心的表示的准确性,我们引入了一种新颖的“极线特征变换器”,它将卷积网络特征从输入视图传输到其他虚拟摄像机视点,从而更好地覆盖3D场景几何。与首先在3D中检测和定位对象,然后使用类别特定模型推断对象形状的现有方法不同,我们的方法是完全卷积的,端到端可微分的,并且避免了体素表示的分辨率和存储器限制。我们展示了多层深度表示和极势变换器在重建大型室内数据库中的优势。
translated by 谷歌翻译
贝叶斯优化算法(BOA)是使用贝叶斯网络作为概率图形模型(PGM)的分布算法估计(EDA)。给定解决方案样本确定最优贝叶斯网络结构是NP难问题。此步骤应在BOA的每次迭代中完成,从而导致非常耗时的过程。出于这个原因,mostimplementations使用贪婪的估计算法,如K2。然而,我们在本文中表明,PGM结构的显着变化不会发生,并且在进化结束时可能特别稀疏。因此,提出了BOA的统计学研究,以表征PGM调整模式,该模式可用作减少进化过程中PGM更新频率的指南。这是通过提出一种新的基于BOA的优化方法(FBOA)来实现的,该方法的PGM不会在每次更新时更新。这种新方法避免了标准BOA中常见的计算负担。结果比较了两种算法在一个NG风景优化问题上的性能,使用了坚固性和预期运行时间相关的枚举实例。实验表明,FBA具有竞争力,同时显着节省了计算时间。
translated by 谷歌翻译
我们提出了无限混合原型来自适应地表示用于少数镜头学习的简单和复杂数据分布。我们的无限混合原型通过一组聚类来表示每个类,而不像现有的原型方法,这些方法通过单个聚类表示每个类。通过增加聚类的数量,无限混合原型在最近邻和原型表示之间进行插值,这改善了少数射击机制中的准确性和鲁棒性。我们展示了捕获复杂数据分布(如字母表)的自适应能力的重要性,与原型网络相比,绝对精度提高了25%,同时仍然保持或提高了标准Omniglot和mini-ImageNetbenchmarks的准确性。在通过相同的聚类规则聚类标记和未标记的数据时,无限混合原型实现了最先进的半监督准确性。作为进一步的能力,我们表明无限混合原型可以执行纯粹的无监督聚类,与现有的原型方法不同。
translated by 谷歌翻译
Max-C和min-D投影自相关模糊形态记忆(max-C和min-D PAFMM)是两层前馈模糊形态神经网络,能够实现为超立方体上的有限模糊集或向量的存储和检索而设计的联想记忆。本文介绍了这些自动关联存储器的主要特征,包括无限的绝对存储容量,存储物品的快速检索,少量的内存存储,以及对任何膨胀噪声的矿物噪声的极好耐受性。特别注意所谓的Zadeh PAFMM,除了不进行浮点运算外,还表现出max-C和min-D PAFMM之间最大的噪声容差。计算实验揭示了Zadeh的max-C PFAMM,结合噪声掩蔽策略,产生了一种快速而强大的分类器,具有很强的人脸识别潜力。
translated by 谷歌翻译
在社交媒体上发布的图像的真实性是一个日益严重的问题。已经开发了许多算法来检测被操纵的图像,但是已经研究了基于深度神经网络的方法来验证图像标签(例如事件名称)的真实性的能力。在本文中,我们提出了几种新方法来预测图像是否在几个值得注意的事件中被捕获。我们使用来自几个记录事件的一组图像,如风暴,马拉松,抗议和其他大型公共聚会。提出了应用预先训练的Imagenet网络进行事件验证的两种策略,每种策略都有两个修改。第一种方法使用来自预训练网络的最后卷积层的特征作为分类器的输入。我们还考虑了调整预训练网络的卷积权重以改善分类的效果。第二种方法结合了从较小尺度提取的许多特征,并使用预先训练的网络的输出作为第二分类器的输入。对于这两种方法,我们研究了几种不同的分类器,并测试了许多不同的预训练网络。我们的实验证明这两种方法都对事件验证和图像重用检测有效。全球范围内的分类倾向于略微优于我们测试的本地方法,并且对网络进行微调可以进一步改善结果。
translated by 谷歌翻译
三年前,我们发布了Omniglot数据集,用于开发更像人类的学习算法。 Omniglot是一次性学习挑战,受人们如何从一个或几个例子中学习新概念的启发。随着数据集,我们提出了一套五个挑战任务和基于概率程序归纳的计算模型。计算模型虽然功能强大,但并不是Omniglot的最后一句话。我们希望机器学习社区能够建立我们的工作并开发新方法来应对挑战。在此期间,我们很高兴看到Omniglot的广泛采用和显着的技术进步。在一次性分类方面取得了真正的进展,但由于研究人员采用了不同的分裂和训练程序,使得任务更容易,因此难以衡量。其他四项任务虽然是人类概念理解的重要组成部分,但受到的关注却少得多。我们回顾了迄今为止的进展,并得出结论认为,神经网络与Omniglot上的人类概念学习相差甚远,这一挑战需要用单一模型执行所有任务。我们还讨论了促进进一步发展的新任务。
translated by 谷歌翻译