我们提出了一种用于训练大规模隐性生成模型的矩量法(MoM)算法。此设置中的矩估计遇到两个问题:通常很难定义所需的数百万个时刻容忍模型参数,并且在指定时刻时很难确定哪些属性是有用的。为了解决第一个问题,我们引入了amoment网络,并将时刻定义为网络的隐藏单位和网络输出的梯度与其参数的关系。为了解决第二个问题,我们使用渐近理论来突出需求模型 - 即它们应该最小化估计模型参数的渐近方差 - 并引入一个目标来学习更好的时刻。通过这种学习时刻(MoLM)方法创建的目标序列可以提供高质量的神经图像采样器。在CIFAR-10上,我们证明了受过MOMM训练的发生器比使用梯度加法正则化和频谱标准化的对抗性目标训练的那些人获得了显着更高的初始分数和更低的开始起始距离。这些发生器还可以实现几乎完美的多尺度结构相似性Scoreson CelebA,并可以创建128x128图像的高质量样本。
translated by 谷歌翻译
我们证明了变分自动编码器始终无法在潜在和可见空间中学习边缘分布。我们问这是否是匹配条件分布的结果,或者是显式模型和后验分布的限制。我们通过在变分推理中使用GenerativeAdversarial Networks来探索由边际分布匹配和隐式分布提供的替代方案。我们对几种VAE-GAN杂种进行了大规模的评估,并探索了类概率估计对学习分布的影响。我们得出结论,目前VAE-GAN杂交种的适用性有限:与VAE相比,它们难以扩展,评估和用于推理;并且他们没有改善GAN的发电质量。
translated by 谷歌翻译
由于最近在处理速度和数据采集和存储方面的进步,机器学习(ML)正在渗透我们生活的方方面面,并从根本上改变了许多领域的研究。无线通信是另一个成功的故事 - 在我们的生活中无处不在,从手持设备到可穿戴设备,智能家居和汽车。虽然近年来在为各种无线通信问题利用ML工具方面看到了一系列研究活动,但这些技术对实际通信系统和标准的影响还有待观察。在本文中,我们回顾了无线通信系统中ML的主要承诺和挑战,主要关注物理层。我们提出了ML技术在经典方法方面取得的一些最令人瞩目的近期成就,并指出了有希望的研究方向,其中ML可能在不久的将来产生最大的影响。我们还强调了在无线网络边缘设计物理层技术以实现分布式ML的重要问题,这进一步强调了理解和连接ML与无线通信中的基本概念的需要。
translated by 谷歌翻译
最近在机器学习(ML)可解释性方面的努力集中于创建解释黑盒ML模型的方法。然而,这些方法基于这样的假设:简单的近似,例如线性模型或决策树,本质上是人类可解释的,并未经过实际测试。此外,过去的努力完全集中在理解上,忽略了探索说服非技术专家(如临床医生)在实践中使用ML模型所必需的信任组件。在本文中,我们假设强化学习(RL)可用于学习不同用户可解释的内容,从而建立他们对ML模型的信任。为验证这一想法,我们首先训练神经网络,为心力衰竭患者提供风险评估。然后,我们围绕神经网络模型设计基于RL的临床决策支持系统(DSS),该系统可以从与用户的交互中学习。我们进行了一项实验,涉及来自三个不同国家的多个机构的各种临床医生。我们的研究结果表明,ML专家无法准确预测哪些系统输出将最大限度地提高临床医生对基础神经网络模型的信心,并提出其他研究结果,这些研究结果对ML解释性研究的未来和ML在医学中的应用具有广泛的意义。
translated by 谷歌翻译
准确预测疾病轨迹对于早期识别和及时治疗有风险的患者至关重要。生存分析中的常规方法通常受到强参数假设的约束,并且限制了它们从高维数据中学习的能力,而现有的神经网络模型不容易适应纵向设置。本文开发了一种解决这些缺点的新型卷积方法。我们提出了MATCH-Net:一种缺失意识时间卷积命中时间网络,旨在捕捉协变量轨迹和缺失模式中的时间依赖性和异构交互。据我们所知,这是对个性化风险预测的动态预测背景下的时间卷积的第一次研究。使用来自阿尔茨海默病神经影像学计划的现实世界数据,我们展示了最先进的性能,而没有做出任何关于潜在纵向或事件发生时间过程的假设,证明了模型在临床决策支持方面的潜在效用。
translated by 谷歌翻译
从观察数据估计个体治疗效果(ITE)在医学中是必不可少的。估算ITE的一个主要挑战是处理混淆因素,这是影响干预及其结果的因素。以前的大多数工作都依赖于无混淆假设,即假设所有混杂因素都是在观察数据中进行测量的。但是,如果存在不可测量的(潜在的)混杂因素,那么就会引入混淆的biasis。幸运的是,潜在混杂因素的嘈杂代理通常是可用的,并且可用于对ITE进行无偏估计。在本文中,我们开发了一种新颖的对抗性学习框架,使用嘈杂的代理来对ITE进行无偏差的估计。
translated by 谷歌翻译
临床医生希望使用风险分层方法来实现信心风险分层 - 不同患者的风险评估很可能反映真实风险。这允许他/她使用这些风险来准确预测关于预测和关于当前患者的筛选,治疗的决定。我们开发了Risk-stratify - 一种两相算法,旨在实现自信的风险分层。在第一阶段,我们种植一棵树来分割协变量空间。使用统计测试来分割树中的每个节点,所述统计测试确定子节点的风险是否不同。统计测试的选择取决于数据是否被审查(对数秩检验)或不检验(U检验)。树的叶子组形成一个分区。与叶子相关的患者的风险分布不同于兄弟叶片而不是其他叶子。因此,具有相似潜在风险的一些叶子被正确地指定具有不同的风险。在第二阶段,我们开发了一种新的递归图分解方法来解决这个问题。对具有类似风险的树叶进行重组以形成形成最终输出的新叶。我们对来自英国生物银行的一组患者(无心血管疾病史)应用Risk-stratify,并评估他们患心血管疾病的风险。风险分层显着改善了风险分层,即,较低比例的群体具有过高/低估的风险(以错误发现率衡量;减少33%),与最先进的心血管预测方法相比较(Randomforests,考克斯模型等)。我们发现Cox模型显着高估了216,211例患者中21,621例患者的风险。 Risk-stratifycan将21,621名患者中的2,987名准确归类为低风险个体。
translated by 谷歌翻译
疾病进展模型有助于预测个体水平的健康轨迹和理解疾病动态。现有模型能够提供对患者预后的准确预测或疾病病理生理学的可解释的表示,但不是。在本文中,我们开发了疾病进展的分阶段注意状态空间(PASS)模型,这是一种深度概率模型,可捕获疾病进展的复杂代表性,同时保持临床解释性。与假定无记忆动力学的马尔可夫状态空间模型不同,PASS使用注意机制来诱导“记忆”状态转换,其中重复更新的注意权重被用于关注最能预测未来状态的状态实现。这产生了tocomplex,非静态状态动态,其仍然可以通过生成的注意权重来解释,其指定个体患者的实现状态变量之间的关系。 PASS使用相位LSTM单元(时间门由参数化振荡控制)在连续时间内生成注意权重,这使得能够处理经常采样和可能缺失的医学观察。来自一个真实世界的患者队列数据的实验表明,PASS成功地平衡了准确性和可解释性之间的权衡:它证明了卓越的预测准确性,并学习了有关疾病进展的个人层面代表性。
translated by 谷歌翻译
随机对照试验(RCT)是比较新治疗方法与当前治疗方案(对照组)的有效性的金标准。大多数RCT通过均匀随机化将患者分配到治疗组和对照组。我们表明,如果 - 通常情况下 - 患者可以在队列中招募(而不是一次性),这个程序可能是高度次优的(在学习方面),在记录之前可以观察到对每个群组的影响。下一个队列,并且在可识别的患者亚组中效果是异质的。我们将患者分配问题制定为有限阶段马尔可夫决策过程,其中目标是最小化给定的I型和II型错误的加权组合。因为找到这个马尔可夫决策过程的确切解决方案在计算上难以处理,我们提出了一种算法 - \ textit {随机控制知识的知识梯度}(RCT-KG) - 产生近似解。我们用伯努利结果说明了合成数据集的算法,并将其与均匀随机化进行了比较。对于给定尺寸的试验,我们的方法实现了显着的误差减少,并达到规定的置信水平(在确定治疗是否优于对照)时,我们的方法需要更少的患者。我们的方法使用从先前队列的影响中学到的东西,以促进更有效学习的方式将患者招募到亚组并在子组内分配患者(到治疗/控制)。
translated by 谷歌翻译
存在多种可能的不利事件(即竞争风险)时的生存分析是许多行业(医疗保健,金融等)中普遍存在的问题。由于通常仅观察到一个事件,因此感兴趣的事件的发生率经常被其他相关的竞争事件所掩盖。这种不可识别性或无法根据经验数据估计真实的原因特异性生存率,进一步使竞争风险存活分析复杂化。我们引入了暹罗生存预测网络(SSPN),这是一种新颖的深度学习架构,用于在存在竞争风险的情况下评估个性化风险评分。 SSPN通过避免估计原因特定的生存曲线来规避不可识别性问题,而是确定随时间一致的时间依赖性风险,其中较长的事件时间被指定为较低的风险。此外,SSPN能够直接优化C-鉴别指数的近似值,而不是依赖于众所周知的指标,这些指标无法用竞争风险捕捉生存分析的独特要求。
translated by 谷歌翻译