我们的粮食安全建立在土壤的基础上。如果土壤不健康,农民将无法用纤维,食物和燃料喂养我们。准确预测土壤的类型有助于规划土壤的使用,从而提高生产率。这项研究采用了最先进的视觉变压器,并与SVM,Alexnet,Resnet和CNN等不同模型进行了比较。此外,这项研究还着重于区分不同的视觉变压器体系结构。对于土壤类型的分类,数据集由4种不同类型的土壤样品组成,例如冲积,红色,黑色和粘土。 Visual Transformer模型在测试和测试时达到98.13%的训练和93.62%的范围,在测试和训练精度方面都优于其他模型。视觉变压器的性能超过了其他模型的性能至少2%。因此,新颖的视觉变压器可用于计算机视觉任务,包括土壤分类。
translated by 谷歌翻译
公路障碍检测是一个重要的研究领域,属于智能运输基础设施系统的范围。基于视觉的方法的使用为此类系统提供了准确且具有成本效益的解决方案。在这篇研究论文中,我们提出了一种使用仪表板视频的自动驾驶自动驾驶汽车的威胁检测机制,以确保在其视觉范围内的道路上存在任何不必要的障碍物。此信息可以帮助车辆的计划安全。有四个主要组件,即Yolo来识别对象,高级车道检测算法,多回归模型,用于测量对象与摄像机的距离,测量安全速度的两秒钟规则和限制速度。此外,我们已经使用了车祸数据集(CCD)来计算模型的准确性。Yolo算法的精度约为93%。我们提出的威胁检测模型(TDM)的最终准确性为82.65%。
translated by 谷歌翻译
分类脑电图(EEG)信号有助于理解脑部计算机界面(BCI)。脑电图信号对于研究人类思维的运作方式至关重要。在本文中,我们使用了一个算术计算数据集,该数据集由计算信号(BC)和计算信号(DC)组成。数据集由36位参与者组成。为了了解大脑中神经元的功能,我们对BCS与DCS进行了分类。对于此分类,我们提取了各种特征,例如相互信息(MI),相位锁定值(PLV)和熵置换熵,光谱熵,奇异值分解熵,近似熵,样品熵。这些功能的分类是使用基于RNN的分类器(例如LSTM,BLSTM,ConvlSTM和CNN-LSTM)完成的。当将熵用作特征并作为分类器时,该模型的精度为99.72%。
translated by 谷歌翻译
大型深度神经网络的联合培训通常可以受到限制,因为将更新与增加模型大小进行交流的成本增加。在集中设置中设计了各种模型修剪技术,以减少推理时间。将集中的修剪技术与联合培训相结合似乎是降低沟通成本的直观 - 通过在沟通步骤之前修剪模型参数。此外,在培训期间,这种渐进的模型修剪方法也可以减少培训时间/成本。为此,我们提出了FedSparsify,该公司在联合培训期间执行模型修剪。在我们在集中式和联合的设置中对大脑年龄预测任务的实验(估计一个人的年龄从大脑MRI估算),我们证明,即使在具有高度异构数据的高度异质数据的挑战性的联盟学习环境中,也可以将模型最多可修剪高达95%的稀疏性,而不会影响表现。分布。模型修剪的一个令人惊讶的好处是改进的模型隐私。我们证明,具有高稀疏性的模型不太容易受到会员推理攻击的影响,这是一种隐私攻击。
translated by 谷歌翻译
当使用临床医生或人工智能(AI)系统的医学图像进行诊断时,重要的是图像具有高质量。当图像质量低时,产生图像的体检通常需要重做。在远程医疗中,一个普遍的问题是,只有在患者离开诊所后才标记质量问题,这意味着他们必须返回才能重做考试。对于居住在偏远地区的人们来说,这可能是特别困难的,他们在巴西的数字医疗组织Portemedicina占了大部分患者。在本文中,我们报告了有关(i)实时标记和解释低质量医学图像的AI系统的正在进行的工作,(ii)采访研究,以了解使用AI系统的利益相关者的解释需求在OurCompany和(iii)纵向用户研究设计,旨在检查包括对我们诊所中技术人员工作流程的解释的效果。据我们所知,这将是评估XAI方法对最终用户的影响的首次纵向研究 - 使用AI系统但没有AI特定专业知识的利益相关者。我们欢迎对我们的实验设置的反馈和建议。
translated by 谷歌翻译
用于训练机器学习(ML)模型的标签至关重要。通常,对于ML分类任务,数据集包含硬标签,但已证明使用软标签的学习可以产生模型概括,鲁棒性和校准的好处。较早的工作发现从多个注释者的硬标签形成软标签方面的成功;但是,这种方法可能不会融合到最佳标签,因此需要许多注释者,这可能是昂贵且效率低下的。我们专注于有效地从单个注释者那里引起软标签。我们通过众包研究($ n = 242 $)收集并发布了CIFAR-10的软标签数据集。我们证明,使用标签学习可以实现可比的模型性能与先前的方法,同时需要更少的注释者。因此,我们的启发方法表明,有望使从业者能够通过更少的注释来享受改善模型性能和可靠性的好处,并为将来的数据集策展人提供指南,以了解从单个注释者那里利用更丰富信息(例如分类不确定性)的好处。
translated by 谷歌翻译
机器学习(ML)从业人员越来越多地承担着与非技术专家的价值观和目标保持一致的模型。但是,关于从业人员如何将域专业知识转化为ML更新的考虑不足。在本文中,我们考虑如何系统地捕获从业者和专家之间的互动。我们设计了一种分类法,以将专家反馈类型与从业者更新相匹配。从业者可以从观察或域级别的专家那里收到反馈,并将此反馈转换为数据集,损耗函数或参数空间的更新。我们回顾了ML和人类计算机互动中的现有工作,以描述这种反馈更高的分类法,并强调了不足以纳入非技术专家的反馈意见。我们以一系列的开放问题结尾,这些问题自然而然地源于我们提议的分类法和随后的调查。
translated by 谷歌翻译
Conformal prediction (CP) is a wrapper around traditional machine learning models, giving coverage guarantees under the sole assumption of exchangeability; in classification problems, for a chosen significance level $\varepsilon$, CP guarantees that the error rate is at most $\varepsilon$, irrespective of whether the underlying model is misspecified. However, the prohibitive computational costs of "full" CP led researchers to design scalable alternatives, which alas do not attain the same guarantees or statistical power of full CP. In this paper, we use influence functions to efficiently approximate full CP. We prove that our method is a consistent approximation of full CP, and empirically show that the approximation error becomes smaller as the training set increases; e.g., for $10^{3}$ training points the two methods output p-values that are $<10^{-3}$ apart: a negligible error for any practical application. Our methods enable scaling full CP to large real-world datasets. We compare our full CP approximation (ACP) to mainstream CP alternatives, and observe that our method is computationally competitive whilst enjoying the statistical predictive power of full CP.
translated by 谷歌翻译
会话问题应答(CQA)系统旨在为用户提供自然语言答案,以信息寻求对话。现有的CQA基准测试与预先收集的人类谈话进行比较模型,使用在会话历史中提供的地面真理答案。它仍然尚不清楚我们是否可以依赖于模型开发的这种静态评估,以及当前系统是否能够充分地概括为现实世界的人机对话。在这项工作中,我们开展了最先进的CQA系统的大规模人类评估,人类评估人员与模型交谈并判断了答案的正确性。我们发现,人机对话的分布与人类谈话的分配急剧不同,并且在模型排名方面存在人和金历史评估之间的分歧。我们进一步调查了如何改进自动评估,并提出基于预测历史的问题重写机制,与人类判断更好地相关。最后,我们讨论了各种建模策略和未来方向对更好的会话问题应答系统的影响。
translated by 谷歌翻译
为了解释来自可差异的概率模型的不确定性估计,最近的工作已经提出了用于给定数据点的单一反事实潜在的不确定性解释(CLUE),其中模型不确定,识别单个,歧管改变到输入,使得模型变为更确定于其预测。我们拓宽了探索{\ delta} -clue,这是潜在空间原始输入的{\ delta}球中的潜在线索集。我们研究了这样的套装的多样性,并发现许多线索是多余的;因此,我们提出了各种线索({\ nabla} -clue),一组线索,每个线索各自提出了一种明显的解释,以及如何减少与输入相关联的不确定性。然后,我们进一步提出了全球摊销线索(Glam-Clue),这是一种独特的和新的方法,它在特定的不确定输入组上学习摊销映射,将它们和有效地将它们的单一函数调用转换为模型将确定的输入。我们的实验表明,{\ delta} -clue,{\ nabla} -clue,以及Glam-clue所有地址线索的缺点,并为从业者提供了对不确定性估计的有益解释。
translated by 谷歌翻译