关联数据消费的一大挑战是为可供非技术用户使用的数据创建可视和自然的语言界面。 Ontodia提供对图解数据探索的支持,在此出版物中结合维基数据集展示。我们提出了关于探索和查询关联数据实体的自然语言界面的改进。该方法使用分布式语义模型来查找与Ontodia中的用户输入相关的运行属性。评估了各种单词嵌入类型和模型设置,结果表明,使用在视觉数据探索方面的经验可以从提出的方法中受益。
translated by 谷歌翻译
这项工作的目的是研究各种机器学习算法的适用性,以预测由于特殊实验室分析而由地球科学家定义的某些岩石属性。我们证明了这些特殊性能只能基于常规核心分析(RCA)数据来预测。在100多个实验室实验中测试了使用可溶性岩石基质组分(盐)从储层中取出岩心样品的方法。实验的挑战是表征由于泥浆或水注入造成的油藏脱盐后岩心中盐的速率和孔隙度和渗透率的变化。对于这三个测量特征,我们开发了相关的预测模型,这些模型基于RCA的结果和取心深度以及生产​​视野的顶部和底部深度的数据。为了选择最精确的机器学习算法,进行了比较分析。结果表明,不同的算法在不同的模型中工作得更好。然而,两个隐层神经网络共同展示了三种岩石特征的最佳预测能力和普遍性。其他算法,例如支持向量机和线性回归,也在数据集上运行良好,但在特定情况下。总体而言,应用的方法可以预测多孔岩石脱盐过程中孔隙度和渗透率的变化,并且无需在实验室直接测量即可评估盐浓度。该工作还表明,已开发的方法可用于预测其他岩石性质(残余盐水和含油饱和度,相对渗透性,毛细管压力等),实验室测量是耗时且昂贵的。
translated by 谷歌翻译
我们提出了SWA-Gaussian(SWAG),一种简单,可扩展,通用的方法,用于深度学习中的不确定性表示和校准。随机权重平均(SWA),计算随机梯度下降(SGD)的第一时刻,用修改的学习率计划迭代最近,我们已经证明了它可以改善深度学习中的泛化。利用SWAG,我们使用SWA解决方案作为第一时刻拟合高斯,并且还从SGD迭代得到秩和对角协方差,在神经网络权重上形成近似后验分布;我们从这个高斯分布中抽样来进行贝叶斯模型平均。 Weempirically发现SWAG近似于真实后验的形状,与描述SGD迭代的静态分布的结果一致。此外,我们证明SWAG在各种计算机视觉任务上表现良好,包括样本外检测,校准和转移学习,与许多流行的替代品相比,包括MC压差,KFACLaplace和温度缩放。
translated by 谷歌翻译
在这项工作中,我们提出了一个随机化的八卦算法,用于解决平均共识问题,同时保护存储在节点上的初始私有值的信息。我们给出了方法的迭代复杂性界限并进行了广泛的数值实验。
translated by 谷歌翻译
随机方差 - 降阶梯度法(SVRG)及其加速变量(Katyusha)在过去几年中引起了机器学习社会的极大关注,因为它们通过经验风险最小化范式在训练有监督的机器学习模型中具有优越的理论性质和经验行为。这两种方法中的关键结构要素是包括外环,在该外环的开始处对训练数据进行完全逾越,以便计算精确的梯度,然后用于构建梯度的方差减小的估计。在这项工作中,我们设计了这两种方法的{\ em无循环变体}。特别是,我们删除了外部循环,并通过在每次迭代中执行的硬币翻转来替换其功能,该迭代被设计为以很小的概率触发梯度的计算。我们证明了新方法与原方法具有相同的超理论收敛性。然而,我们通过数值实验证明我们的方法具有实质上优越的实际行为。
translated by 谷歌翻译
我们考虑从贝叶斯模型的后验分布中采样的问题,其中一些参数被限制为正交矩阵。这些矩阵有时用于神经网络模型,原因是训练过程的规范化和稳定化,并且还可以参数化有界秩,正定矩阵等矩阵。在文章{byrne2013geodesic}中,作者已经考虑使用精确的测地流来从流形上的分布进行采样在一个类似于汉密尔顿蒙特卡洛(HMC)的计划中。我们为一组基于相同方法的正交矩阵提出了新的采样方案,使用了黎曼优化的思想,并且不需要精确计算地球流。理论上,该方法通过所提出的迭代的辛算证明来证明。在实验中,我们表明新方案在每次迭代中具有可比性或更快的时间,并且与传统的HMC和显式正交参数化以及GeodesicMonte-Carlo相比,样本效率更高。我们还提供了贝叶斯集成正交神经网络和低秩矩阵分解的有希望的结果。
translated by 谷歌翻译
在最近深度强化学习方法取得成功的基础上,我们通过使用来自多个连续政策的数据来研究政策强化学习改进的可能性。政策上的方法带来很多好处,例如评估每个结果政策的能力。但是,它们通常会丢弃之前存在的所有政策信息。在这项工作中,我们建议调整重放缓冲区概念,借鉴非政策学习环境,创建方法,结合政策和非政策学习的优势。为了实现这一点,所提出的算法为来自多个策略的数据提供了$ Q $ - ,值和优势函数。该方法使用信任区域优化,同时避免了诸如TRPO或ACKTR之类的算法的一些常见问题:它使用超参数替换信任区域选择启发法,以及可训练协方差矩阵而不是固定协方差矩阵。在许多情况下,与最先进的信任区域政策学习算法(如PPO,ACKTR和TRPO)相比,该方法不仅改善了结果,而且还与其政策外对应的DDPG相关。
translated by 谷歌翻译
当手动注释(标签)容易出错,昂贵,繁琐且耗时时,缺乏足够的标记数据是构建基于机器学习的模型的主要问题。在本文中,我们引入了一种迭代的基于迭代学习的方法,以基于应用于扩展景深(EDF)图像的感兴趣区域的无偏立体学来改进细胞的分割和计数。该方法使用称为自适应分割算法(ASA)的现有机器学习算法来生成用于EDF图像的掩模(由用户验证)以训练深度学习模型。然后,使用迭代的加深学习方法将新预测和接受的深学习掩模/图像(由用户验证)馈送到深度学习模型的训练集。在基于迭代深度学习的无偏立体过程的5次迭代之后,看不见的测试集上的无偏立体计数中的错误率从大约3%降低到小于1%。
translated by 谷歌翻译
我们提出了一种评估油藏多相流体动力学的新技术。我们展示了一种有效的工作流程,用于处理三维油藏模拟数据,其方式与常规程序相比具有数量级。工作流程(我们称之为“Metamodel”)基于系统动力学投影到潜变量空间,使用变分自动编码器模型,其中递归神经网络预测动力学。我们表明,在接受传统储层建模的多个结果训练后,Metamodel不会以显着的方式损害储层动力学重建的准确性。它不仅可以预测井的流速,还可以预测储层内的压力和流体饱和度的动态。结果为油田开发的优化开辟了新的视角,因为情景筛选可以充分加速。
translated by 谷歌翻译
在这项工作中,我们讨论了基于物理方法的线性颜色分割的已知算法,并提出了分段算法的新修改。该算法基于区域邻接图框架而没有预分割阶段。建议的边缘权重函数由具有正常噪声的线性图像模型定义。色空间投影变换作为一种新颖的预处理技术被引入,以更好地处理阴影和高光区域。得到的算法在基准数据集上进行测试,该基准数据集包括从巴纳德的DXC-930 SFU数据集中选择的19个自然场景的图像和新发布的12个自然场景图像以供常用。数据集为每个图像提供逐个像素的地面真实委托。使用该数据集,我们表明所提出的算法修改比其他基于模型的分割算法具有定性优势,并且还显示了每个提出的修改的积极效果。这项工作的源代码和数据集可在http://github.com/visillect/segmentation上免费访问。
translated by 谷歌翻译