工业商店地板见证人类和机器人在一致和家庭家庭中成为这两个代理商的共同空间的未来。科学界通过扩展他们在人类机器人互动方面的研究工作向人类机器人合作而扩展到未来。人形机器人的拟人化本质可能会认为最适合于半结构化,以人为中心的环境中的合作。针对人类试剂的可穿戴感应技术和人类机器人的有效人力意识控制策略将是实现无缝人类人类合作的关键。在这里,可靠的状态估计策略对于理解来自人类的多个分布式传感器以及机器人上的多个分布式传感器至关重要,以增强为人类机器人设计的反馈控制器,以帮助其人类。在这种情况下,本文研究了针对人形运动和人类运动估计的谎言群体的谎言群体理论。 [继续]
translated by 谷歌翻译
We present in this paper a family of generalized simultaneous perturbation stochastic approximation (G-SPSA) estimators that estimate the gradient of the objective using noisy function measurements, but where the number of function measurements and the form of the gradient estimator is guided by the desired estimator bias. In particular, estimators with more function measurements are seen to result in lower bias. We provide an analysis of convergence of the generalized SPSA algorithm, and point to possible future directions.
translated by 谷歌翻译
This paper proposes an easy-to-compute upper bound for the overlap index between two probability distributions without requiring any knowledge of the distribution models. The computation of our bound is time-efficient and memory-efficient and only requires finite samples. The proposed bound shows its value in one-class classification and domain shift analysis. Specifically, in one-class classification, we build a novel one-class classifier by converting the bound into a confidence score function. Unlike most one-class classifiers, the training process is not needed for our classifier. Additionally, the experimental results show that our classifier \textcolor{\colorname}{can be accurate with} only a small number of in-class samples and outperforms many state-of-the-art methods on various datasets in different one-class classification scenarios. In domain shift analysis, we propose a theorem based on our bound. The theorem is useful in detecting the existence of domain shift and inferring data information. The detection and inference processes are both computation-efficient and memory-efficient. Our work shows significant promise toward broadening the applications of overlap-based metrics.
translated by 谷歌翻译
We propose a framework in which multiple entities collaborate to build a machine learning model while preserving privacy of their data. The approach utilizes feature embeddings from shared/per-entity feature extractors transforming data into a feature space for cooperation between entities. We propose two specific methods and compare them with a baseline method. In Shared Feature Extractor (SFE) Learning, the entities use a shared feature extractor to compute feature embeddings of samples. In Locally Trained Feature Extractor (LTFE) Learning, each entity uses a separate feature extractor and models are trained using concatenated features from all entities. As a baseline, in Cooperatively Trained Feature Extractor (CTFE) Learning, the entities train models by sharing raw data. Secure multi-party algorithms are utilized to train models without revealing data or features in plain text. We investigate the trade-offs among SFE, LTFE, and CTFE in regard to performance, privacy leakage (using an off-the-shelf membership inference attack), and computational cost. LTFE provides the most privacy, followed by SFE, and then CTFE. Computational cost is lowest for SFE and the relative speed of CTFE and LTFE depends on network architecture. CTFE and LTFE provide the best accuracy. We use MNIST, a synthetic dataset, and a credit card fraud detection dataset for evaluations.
translated by 谷歌翻译
在本文中,我们提出了一种随机梯度算法,用于最大程度地减少对嘈杂成本样本的期望,而对于任何给定参数,则只观察到后者。我们的算法采用带有随机扰动的梯度估计方案,该方案是使用单位球体截断的cauchy分布形成的。我们分析了提出的梯度估计量的偏差和方差。发现我们的算法在目标函数是非凸且参数维度较高的情况下特别有用。从渐近收敛分析中,我们确定我们的算法几乎可以肯定地收敛到目标函数的固定点并获得渐近收敛速率。我们还表明,我们的算法避免了不稳定的平衡,这意味着与局部最小值的融合。此外,我们对我们的算法进行非反应收敛分析。特别是,我们在这里建立了一个非质子绑定,用于寻找非convex目标函数的$ \ epsilon $ stationary点。最后,我们通过模拟以数字方式证明我们的算法的性能在一些非凸面设置上优于GSF,SPSA和RDSA,并进一步验证其在凸(NOISY)目标上的性能。
translated by 谷歌翻译
随着现代世界的不可阻碍的数字化,技术领域的每个子集都会不断发展。这样的子集就是如此受欢迎的数字图像。图像并不总是像您希望的那样在视觉上令人愉悦或清晰,并且经常被噪音扭曲或掩盖。随着岁月的流逝,已经出现了许多增强图像的技术,所有这些技术都具有各自的利弊。在本文中,我们研究了一种特殊的技术,该技术在通常被称为自动编码器的神经网络模型的帮助下完成了这项任务。我们为模型构建不同的体系结构,并比较结果,以决定最适合该任务的架构。简短地讨论了模型的特征和工作,这可以帮助为将来的研究树立途径。
translated by 谷歌翻译
基于实用的缺点风险(UBSR)是一种风险指标,越来越受到金融应用中的流行,由于它享有的某些理想的属性。我们考虑在递归设置中估算UBSR的问题,其中来自潜在损耗分布的样本是一次性的。我们将UBSR估计问题作为根发现问题,并提出了基于随机近似的估计方案。我们在样本数量的估计误差中获得了非渐近界。我们还考虑在随机变量的参数化类中的UBSR优化问题。我们提出了一种用于UBSR优化的随机梯度下降算法,并导出其收敛性的非渐近界。
translated by 谷歌翻译
对多人体育广播视频中的关键参与者和行动的全面了解是一个具有挑战性的问题。与新闻或金融视频不同,体育视频有限。虽然对多人体育和玩家的检测的操作识别都有强大的研究,但了解视频帧中的上下文文本仍然是体育视频理解中最有影响力的途径之一。在这项工作中,我们研究体育时钟的极其准确的语义文本检测和识别,以及其中的挑战。我们遵守运动时钟的独特属性,这使得难以利用通用预训练的探测器和识别器,因此可以准确地理解文本以与外部知识对齐的程度。我们提出了一种新的遥远监督技术来自动构建体育时钟数据集。除了合适的数据增强之外,与任何最先进的文本检测和识别模型架构相结合,我们提取极其准确的语义文本。最后,我们分享了我们的计算架构流水线,以扩展工业设置中的该系统,并提出了一个强大的数据集,以验证我们的结果。
translated by 谷歌翻译
我们通过失真风险度量(DRM)解决了风险敏感的增强学习(RL)环境中控制问题的问题。我们提出了策略梯度算法,该算法最大程度地提高了累积奖励的DRM,以在政策和损失的RL设置中进行情节的马尔可夫决策过程。我们采用两种不同的方法来设计政策梯度算法。在第一种方法中,我们得出了构成DRM目标的策略梯度定理的变体,并与基于可能的梯度估计方案结合使用该定理。在第二种方法中,我们从累积奖励的经验分布中估算了DRM,并使用此估计方案以及基于功能的平滑梯度估计方案。对于使用这两种方法的策略梯度算法,我们得出了非反应界限,这些界限将收敛建立到DRM目标的近似固定点。
translated by 谷歌翻译
本文提出了针对回顾性神经网络(Badnets)的新型两级防御(NNOCULICULE),该案例在响应该字段中遇到的回溯测试输入,修复了预部署和在线的BADNET。在预部署阶段,NNICULICULE与清洁验证输入的随机扰动进行检测,以部分减少后门的对抗影响。部署后,NNOCULICULE通过在原始和预先部署修补网络之间录制分歧来检测和隔离测试输入。然后培训Constcan以学习清洁验证和隔离输入之间的转换;即,它学会添加触发器来清洁验证图像。回顾验证图像以及其正确的标签用于进一步重新培训预修补程序,产生我们的最终防御。关于全面的后门攻击套件的实证评估表明,NNOCLICULE优于所有最先进的防御,以制定限制性假设,并且仅在特定的后门攻击上工作,或者在适应性攻击中失败。相比之下,NNICULICULE使得最小的假设并提供有效的防御,即使在现有防御因攻击者而导致其限制假设而导致的现有防御无效的情况下。
translated by 谷歌翻译