一旦处理高维数据或冗余传感器信号,大多数现有的特征选择方法不足以用于分析目的,因为由于虚假效应或相关性而不是因果效应可以选择特征。为了支持在生物医学实验中发现因果特征,我们在此提出了FRI,这是一个开源Python库,可用于识别线性分类和(序数)回归问题中的所有相关变量。使用最近提出的特征相关方法,FRI能够为进一步的基因实验提供基础,或者特定的可以促进对替代生物标记的搜索。它可以在交互式环境中使用,通过提供模型操作和可视化方法,或在批处理过程中用作过滤方法。
translated by 谷歌翻译
进化算法已被广泛用于一系列随机优化问题。在大多数研究中,目标是优化解决方案的预期质量。受约束性违反具有极大破坏性影响的现实问题的启发,我们考虑了背包问题的一种变体,即利用最大$ $ alpha $的小概率违反背包容量限制的约束下利润最大化。这个问题被称为机会约束的背包问题,而且机会约束优化问题迄今为止在进化计算文献中很少受到关注。我们展示了如何在通过进化算法解决这些问题时使用流行的偏差等值,如Chebyshev不等式和Chernoff边界作为解决方案评估的一部分,并将我们的算法的有效性与广泛的机会约束背包实例进行比较。
translated by 谷歌翻译
信任区域方法在政策搜索中产生了最先进的结果。一种常见的方法是使用KL-分歧来约束自然梯度政策更新中的信任区域。我们表明,如果我们使用标准指数策略分布的自然参数化与兼容值函数近似相结合,则自然梯度和信赖域优化是等价的。此外,我们表明,标准自然梯度更新可能会根据导致早熟收敛的错误计划减少策略的熵。为了控制熵减少,我们引入了一种新的策略搜索方法,称为兼容策略搜索(COPOS),它限制了熵损失。实验结果表明,COPOS产生最先进的结果,具有挑战性的连续控制任务和不可分割的部分可观测任务。
translated by 谷歌翻译
当一个问题实例被一个小的修改扰乱时,人们希望通过构建前一个的已知商品解决方案来为新实例找到一个好的解决方案。通过严格的数学分析,我们证明了进化算法尽管通常是强大的问题解决者,但在解决这种重新优化问题时可能会遇到意想不到的困难。当使用最优的随机汉明邻居时,(1 + 1)进化算法需要$ \ Omega(n ^ 2)$时间来优化LeadingOnes基准函数,这与在随机选择的解决方案中启动时的渐近优化时间相同。因此,从优化结构上良好的解决方案中没有显着的优势。然后,我们提出了克服这些困难的方法。正如我们的数学分析所揭示的那样,这种不良行为的原因在于,在优化过程中,结构良好的解决方案可以很容易地被具有相同或更好适应性的结构更强的解决方案所取代。我们提出了一种简单的多样性机制来防止这种行为,从而将LeadingOnes的重新优化时间减少到$ O(\ gamma \ delta n)$,其中$ \ gamma $是多样性机制使用的群体大小和$ \ delta \ le \ gamma $前一解决方案的新优化的汉明距离。我们显示了类似的快速优化时间,用于通过改变约束和最小生成树问题来优化线性函数。
translated by 谷歌翻译
光学相干断层扫描(OCT)已成为眼科学中最重要的成像模式。最近,大量研究被用于开发机器学习(ML)模型,用于OCT图像中病理特征的识别和量化。在ML模型必须处理的几个可变性来源中,主要因素是采集设备,其可以限制ML模型的可归一化性。在本文中,我们建议通过使用不受监督的非配对图像变换算法CycleGAN来降低不同OCT设备(Spectralis和Cirrus)的图像变化。在视网膜液分割的设置中评估该方法的有用性,即视网膜下囊液(IRC)和视网膜下液(SRF)。首先,我们在使用源OCT设备获取的图像上训练分段模型。然后我们在(1)源,(2)目标和(3)目标OCT图像的变换版本上评估模型。所提出的转换策略显示IRC(SRF)分割的F1得分为0.4(0.51)。与传统的转换方法相比,这意味着F1得分为0.2(0.12)。
translated by 谷歌翻译
研究了在高维输入和目标数据学习框架中使用正交投影。首先,我们研究了两个标准目标在降维,最大化方差和保持成对相对距离方面的关系。它们的渐近相关和数值实验的推导表明,预测通常不能满足两个目标。在标准分类问题中,我们确定输入数据的投影,以平衡它们并比较后续结果。接下来,我们将正交投影的应用扩展到深度学习框架。我们引入了新的变分损失函数,可以通过目标数据的变换和投影来集成其他信息。在两个监督学习问题,临床图像分割和音乐信息分类中,所提出的损失函数的应用提高了准确性。
translated by 谷歌翻译
本文的目的是激励数据科学家参与其专业工作对社会的影响,并积极参与数字世界作为数据科学专业人士的公开辩论。道德原则如何(如公平,正义) ,仁慈和非男性)与我们的职业生活有关?我们在该领域的专业知识作为专业人员的责任在于什么?更具体地说,本文呼吁统计学家加入这场辩论,并成为社区的一部分,将数据科学建立为Airaksinen意义上的专业人士,Airaksinen是一位致力于职业理论的哲学家。正如我们所说的那样,数据科学的一个根源在于统计学和它之外的应用。为了塑造统计学的未来,并承担统计数据科学贡献的责任,统计学家应积极参与讨论。首先,定义了数据科学这一术语,并概述了导致数据科学对社会产生强烈影响的技术变革。接下来介绍了CNIL的系统方法。针对数据科学家工作中产生的伦理问题给出了突出的例子。此外,我们还提供了数据科学家为塑造道德形成并制定数据科学行为准则和行为准则的原因。接下来,我们为统计和计算机械的相关领域提出既定的道德准则。此后,描述了社区中开发数据科学职业道德的必要步骤。最后,我们给出了辩论的开始陈述:数据科学是当前社会发展的焦点。如果不是一个具有职业道德的专业,数据科学将无法建立信任与其相互作用和它急需的贡献!
translated by 谷歌翻译
许多具有挑战性的图像处理任务可以通过一个不合理的线性逆问题来描述:去模糊,去卷积,修复,压缩传感和超分辨率都在这个框架中。传统的反向解算器最小化了由数据拟合项组成的成本函数,该数据拟合项用于测量图像与观察结果的匹配程度,以及正则化器,其反映先验知识并促进具有期望属性的图像。机器学习和图像处理方面的最新进展表明,通常可以从训练数据中学习一个能够胜过更传统的正规化器的正规化器。我们提出了一种端到端的数据驱动方法,用于解决受Neumann系列启发的逆问题,我们将其称为Neumann网络。我们不是展开迭代优化算法,而是截断Neumann序列,它直接用数据驱动的非线性正则化器解决线性逆问题。 Neumann网络体系结构优于传统的反问题解决方法,无模型深度学习方法,以及标准数据集上最先进的展开迭代方法。最后,当图像属于子空间的并集并且在前向模型的适当假设下,我们证明存在Neumann网络配置,该结构很好地逼近逆问题的最优估计,并且凭经验证明训练的Neumann网络具有理论预测的形式。 。
translated by 谷歌翻译
研究人员和金融专业人员需要强大的计算机化工具,使用户能够快速操作和评估财经新闻中的语义文本内容。然而,现有方法通常在文献层面工作,而对个别句子的实际结构和情感的深入洞察仍然模糊。因此,投资者需要应用最高的关注度和详细的,特定领域的知识,以便在细粒度的基础上评估信息。为了促进这种手动过程,本文提出使用分布式文本表示和多实例学习将信息从文档级转移到句子级。与替代方法相比,该方法具有优越的预测性能,同时保留了背景和可解释性。我们对手动标记数据集的分析产生了高达69.90%的预测准确度,超过了替代方法的性能至少3.80个百分点。因此,这项研究不仅有利于投资者的财务决策,而且还有助于公司按照预期传达他们的信息。
translated by 谷歌翻译
检测意外坠落对于独居老人的环境智能和保健至关重要。近年来,深度卷积网被广泛用于人类行为分析,在此基础上已经提出了许多降落检测方法。尽管它们具有高效的性能,但卷积网如何识别掉落的行为仍然不明确。在本文中,我们不是提出一种新颖的方法,而是试图进行系统的实证研究,试图研究下面的秋季识别过程。我们提出了四个要研究的任务,其中涉及五种类型的输入模态,七种网络实例和不同的训练样本。获得的定量和定性结果揭示了网络倾向于学习的模式,以及几个可能严重影响秋季识别性能的因素。我们希望我们的结论有利于提出更好的深度学习解决方案来降低检测系统。
translated by 谷歌翻译