对使用因果机器学习模型做出的决策的现实测试是成功应用的基本先决条件。我们专注于评估和改善上下文治疗作业决策:这些是适用于例如客户,每个都有自己的上下文信息,以最大程度地获得奖励。在本文中,我们介绍了一个模型不足的框架,用于收集数据,以通过贝叶斯实验设计评估和改善上下文决策。具体而言,我们的方法用于对过去治疗作业的遗憾的数据有效评估。与A/B测试之类的方法不同,我们的方法避免了分配已知是高度优势的治疗方法,同时进行一些探索以收集相关信息。我们通过引入一个基于信息的设计目标来实现这一目标,我们优化了端到端。我们的方法适用于离散和连续治疗。在几项仿真研究中,将我们的信息理论方法与基准者进行比较,这表明了我们提出的方法的出色表现。
translated by 谷歌翻译
因果推断对于跨业务参与,医疗和政策制定等领域的数据驱动决策至关重要。然而,关于因果发现的研究已经与推理方法分开发展,从而阻止了两个领域方法的直接组合。在这项工作中,我们开发了深层端到端因果推理(DECI),这是一种基于流动的非线性添加噪声模型,该模型具有观察数据,并且可以执行因果发现和推理,包括有条件的平均治疗效果(CATE) )估计。我们提供了理论上的保证,即DECI可以根据标准因果发现假设恢复地面真实因果图。受应用影响的激励,我们将该模型扩展到具有缺失值的异质,混合型数据,从而允许连续和离散的治疗决策。我们的结果表明,与因果发现的相关基线相比,DECI的竞争性能和(c)在合成数据集和因果机器学习基准测试基准的一千多个实验中,跨数据类型和缺失水平进行了估计。
translated by 谷歌翻译
我们引入隐深自适应设计(iDAD),在实时与隐性模型进行适应性实验的新方法。iDAD通过学习设计政策网络的前期,然后可以在实验时快速部署摊销贝叶斯优化实验设计(BOED)的成本。该iDAD网络可以在其模拟微样品,不同于需要一个封闭的形式可能性和条件独立实验以前的设计政策工作的任何模型进行训练。在部署时,iDAD允许以毫秒为单位进行设计决策,而相比之下,需要实验本身期间繁重的计算传统BOED方法。我们说明了多项实验iDAD的适用性,并表明它提供了与隐式模型进行适应性设计一个快速和有效的机制。
translated by 谷歌翻译
学习有意义的数据表示,可以解决诸如批处理效应校正和反事实推断之类的挑战,这在包括计算生物学在内的许多领域中都是一个核心问题。采用有条件的VAE框架,我们表明表示和条件变量之间的边际独立性在这两个挑战中都起着关键作用。我们提出了后代方法的对比混合物(COMP)方法,该方法使用了根据变异后代的混合物定义的新型未对准惩罚,以在潜在空间中实现这种独立性。我们表明,与以前的方法相比,COMP具有有吸引力的理论特性,并且在其他假设下,我们证明了COMP的反事实可识别性。我们在一系列具有挑战性的任务上展示了最先进的表现,包括将人类肿瘤样品与癌细胞线对准,预测转录组级的扰动反应以及单细胞RNA测序数据的批次校正。我们还发现与公平代表学习的相似之处,并证明Comp在该领域的共同任务上具有竞争力。
translated by 谷歌翻译
User and product information associated with a review is useful for sentiment polarity prediction. Typical approaches incorporating such information focus on modeling users and products as implicitly learned representation vectors. Most do not exploit the potential of historical reviews, or those that currently do require unnecessary modifications to model architecture or do not make full use of user/product associations. The contribution of this work is twofold: i) a method to explicitly employ historical reviews belonging to the same user/product to initialize representations, and ii) efficient incorporation of textual associations between users and products via a user-product cross-context module. Experiments on IMDb, Yelp-2013 and Yelp-2014 benchmarks show that our approach substantially outperforms previous state-of-the-art. Since we employ BERT-base as the encoder, we additionally provide experiments in which our approach performs well with Span-BERT and Longformer. Furthermore, experiments where the reviews of each user/product in the training data are downsampled demonstrate the effectiveness of our approach under a low-resource setting.
translated by 谷歌翻译
Large language models (LLMs) that have been trained on multilingual but not parallel text exhibit a remarkable ability to translate between languages. We probe this ability in an in-depth study of the pathways language model (PaLM), which has demonstrated the strongest machine translation (MT) performance among similarly-trained LLMs to date. We investigate various strategies for choosing translation examples for few-shot prompting, concluding that example quality is the most important factor. Using optimized prompts, we revisit previous assessments of PaLM's MT capabilities with more recent test sets, modern MT metrics, and human evaluation, and find that its performance, while impressive, still lags that of state-of-the-art supervised systems. We conclude by providing an analysis of PaLM's MT output which reveals some interesting properties and prospects for future work.
translated by 谷歌翻译
This work provides a Deep Reinforcement Learning approach to solving a periodic review inventory control system with stochastic vendor lead times, lost sales, correlated demand, and price matching. While this dynamic program has historically been considered intractable, our results show that several policy learning approaches are competitive with or outperform classical methods. In order to train these algorithms, we develop novel techniques to convert historical data into a simulator. On the theoretical side, we present learnability results on a subclass of inventory control problems, where we provide a provable reduction of the reinforcement learning problem to that of supervised learning. On the algorithmic side, we present a model-based reinforcement learning procedure (Direct Backprop) to solve the periodic review inventory control problem by constructing a differentiable simulator. Under a variety of metrics Direct Backprop outperforms model-free RL and newsvendor baselines, in both simulations and real-world deployments.
translated by 谷歌翻译
相干显微镜技术提供了跨科学和技术领域的材料的无与伦比的多尺度视图,从结构材料到量子设备,从综合电路到生物细胞。在构造更明亮的来源和高速探测器的驱动下,连贯的X射线显微镜方法(如Ptychography)有望彻底改变纳米级材料的特征。但是,相关的数据和计算需求显着增加意味着,常规方法不再足以从高速相干成像实验实时恢复样品图像。在这里,我们演示了一个工作流程,该工作流利用边缘的人工智能和高性能计算,以实现直接从检测器直接从检测器流出的X射线ptychography数据实时反演。拟议的AI支持的工作流程消除了传统的Ptychography施加的采样约束,从而使用比传统方法所需的数据较少的数据级允许低剂量成像。
translated by 谷歌翻译
为了识别专业知识,预测者不应通过其校准评分来测试,这总是可以任意地使其缩小,而应通过其勃起得分进行测试。布里尔分数是校准得分和改进得分的总和;后者衡量了以相同的预测分类为垃圾箱的好成绩,因此证明了“专业知识”。这就提出了一个问题,即人们是否可以在不失去专业知识的情况下获得校准,我们称这是“量化”。我们提供了一种简单的方法,可以通过确定性的在线程序来计算任何预测。我们还表明,可以通过校准的随机过程来实现量化,然后将结果扩展到同时对多个过程进行定位,并确定不断校准的过程。
translated by 谷歌翻译
计算机断层扫描(CT)是一种成像技术,其中以不同角度(称为投影或扫描)收集有关对象的信息。然后,通过解决反问题来产生显示切片的内部结构的横截面图像。受辐射剂量,投影角,产生的图像等某些因素的限制可能是嘈杂的或包含伪像的。受到《变形金刚在自然语言处理》中的成功的启发,这项初步研究的核心思想是将层析成像的投影视为单词令牌,而整个横截面(又称Sinogram)的整体扫描是在句子中作为句子。自然语言处理。然后,我们通过训练蒙版辛图模型(MSM)和微调MSM来探索基础模型的想法,以获取各种下游应用程序,包括数据集合限制(例如,光子预算)和数据驱动的解决方案,以近似于数据驱动的解决方案CT重建的逆问题。本研究中使用的模型和数据可在https://github.com/lzhengchun/tomotx上获得。
translated by 谷歌翻译