本文致力于一种谨慎的学习方法,用于预测以二进制属性为特征的替代方案(正式,每个替代方案都被视为属性的子集)。通过“谨慎”,我们的意思是,该模型学会了代表多属性偏好的概括足以与替代方案的任何严格的弱顺序兼容,并且我们允许我们自己不预测某些偏好,如果收集到的数据不兼容具有可靠的预测。如果所有最简单的模型(遵循OCCAM的剃须刀原理)解释培训数据一致,则预测的偏好将被认为是可靠的。预测基于替代方案之间的序数优势关系[Fishburn和Lavalle,1996]。优势关系依赖于不确定性集,该设置包含多属性实用程序函数参数的可能值。提供数值测试以评估所做预测的丰富性和可靠性。
translated by 谷歌翻译
尽管在机器学习的方法论核心中是一个问题,但如何比较分类器仍未达成一致的共识。每个比较框架都面临着(至少)三个基本挑战:质量标准的多样性,数据集的多样性以及选择数据集选择的随机性/任意性。在本文中,我们通过采用决策理论的最新发展,为生动的辩论增添了新的观点。我们最终的框架基于所谓的偏好系统,通过广义的随机优势概念对分类器进行排名,该概念强大地绕过了繁琐的,甚至通常是自相矛盾的,对聚合的依赖。此外,我们表明,可以通过解决易于手柄的线性程序和通过适应的两样本观察随机化测试进行统计测试来实现广泛的随机优势。这确实产生了一个有力的框架,可以同时相对于多个质量标准进行分类器的统计比较。我们在模拟研究和标准基准数据集中说明和研究我们的框架。
translated by 谷歌翻译
我们研究了基于消费者的决策积极学习非参数选择模型的问题。我们提出一个负面结果,表明这种选择模型可能无法识别。为了克服可识别性问题,我们介绍了选择模型的有向无环图(DAG)表示,从某种意义上说,该模型可以捕获有关选择模型的更多信息,从而可以从理论上识别信息。然后,我们考虑在主动学习环境中学习与此DAG表示的近似的问题。我们设计了一种有效的主动学习算法,以估计非参数选择模型的DAG表示,该模型在多项式时间内运行时,当随机均匀地绘制频繁排名。我们的算法通过主动和反复提供各种项目并观察所选项目来了解最受欢迎的频繁偏好项目的分布。我们表明,与相应的非活动学习估计算法相比,我们的算法可以更好地恢复有关消费者偏好的合成和公开数据集的一组频繁偏好。这证明了我们的算法和主动学习方法的价值。
translated by 谷歌翻译
In this paper, we provide a theoretical framework to analyze an agent who misinterprets or misperceives the true decision problem she faces. Within this framework, we show that a wide range of behavior observed in experimental settings manifest as failures to perceive implications, in other words, to properly account for the logical relationships between various payoff relevant contingencies. We present behavioral characterizations corresponding to several benchmarks of logical sophistication and show how it is possible to identify which implications the agent fails to perceive. Thus, our framework delivers both a methodology for assessing an agent's level of contingent thinking and a strategy for identifying her beliefs in the absence full rationality.
translated by 谷歌翻译
我们研究了通过中等数量的成对比较查询引发决策者偏好的问题,以使它们成为特定问题的高质量推荐。我们受到高赌场域中的应用程序的推动,例如选择分配稀缺资源的政策以满足基本需求(例如,用于移植或住房的肾脏,因为那些经历无家可归者),其中需要由(部分)提出引出的偏好。我们在基于偏好的偏好中模拟不确定性,并调查两个设置:a)脱机偏出设置,其中所有查询都是一次,b)在线诱因设置,其中按时间顺序选择查询。我们提出了这些问题的强大优化制剂,这些问题集成了偏好诱导和推荐阶段,其目的是最大化最坏情况的效用或最小化最坏情况的后悔,并研究其复杂性。对于离线案例,在活动偏好诱导与决策信息发现的两个半阶段的稳健优化问题的形式中,我们提供了我们通过列解决的混合二进制线性程序的形式提供了等效的重构。 -Constraint生成。对于在线设置,主动偏好学习采用多级强大优化问题的形式与决策依赖的信息发现,我们提出了一种保守的解决方案方法。合成数据的数值研究表明,我们的方法在最坏情况级别,后悔和效用方面从文献中倾斜最先进的方法。我们展示了我们的方法论如何用于协助无家可归的服务机构选择分配不同类型的稀缺住房资源的政策,以遇到无家可归者。
translated by 谷歌翻译
本文提出了一个基于对MCDM问题的概率解释的贝叶斯框架,并涵盖了几种众所周知的多准则决策(MCDM)方法。由于贝叶斯模型的灵活性,该拟议的框架可以以统计优雅的方式解决MCDM中的几个长期存在的基本挑战,包括小组决策问题和标准相关性。同样,该模型可以在决策者(DMS)的偏好(例如正常和三角形分布以及间隔偏好)的偏好(DMS)中适应不同形式的不确定性。此外,开发了一个概率混合模型,该模型可以将DMS分为几个详尽的类别。概率排名方案也是针对标准和替代方案设计的,它标识了一个标准/替代方案比基于DM(S)偏好更重要的程度。该实验在几个数字示例上验证了所提出的框架的结果,并与其他方法相比突出了其显着特征。
translated by 谷歌翻译
在许多领域,建模代理对一组替代方案的偏好是主要问题。主要的方法是找到一个单一的奖励/效用功能,其属性是替代奖励比产生较低奖励的替代方案所优选的。但是,在许多情况下,偏好是基于多个,经常竞争的目标。单个奖励功能不足以代表此类偏好。本文提出了一种推断代理观察到的偏好的多目标奖励表示的方法。我们将代理在不同目标上的优先级建模为输入词典,因此,仅当代理关于较高优先级的目标无动于衷时,优先级较低的目标就很重要。我们提供了两个受癌症治疗启发的医疗保健中的示例申请,另一种是受器官移植的启发,以说明我们学到的词典订购的奖励如何可以更好地了解决策者的偏好,并在加强加固时帮助改善政策学习。
translated by 谷歌翻译
本文考虑了在线配置器通常使用的一组替代方案中学习用户偏好的任务。在许多设置中,学习者在过去的互动过程中只有一组选定的替代方案。Fargier等。[2018]提出了一种在这种环境中学习用户偏好模型的方法,该模型对先前选择的替代方案进行了排名尽可能高;以及在这种情况下学习的算法,是一种特定的偏好模型:词典偏好树(LP-Trees)。在本文中,我们研究了与这种方法相关的复杂性理论问题。我们对学习LP-Tree的样本复杂性给出了上限,这在属性数量上是对数。我们还证明,计算最小化经验风险的LP树当仅限于线性LP-Trees的类别时,可以在多项式时间内完成。
translated by 谷歌翻译
推荐系统是帮助用户以个性化方式找到信息过载的兴趣项目,使用关于各用户的需求和偏好的知识。在会话推荐方法中,这些需求和偏好由系统中的交互式多匝对话框中的。文献中的一种常见方法来驱动这些对话框是逐步向用户逐步询问他们关于期望和不期望的项目特征或关于单个项目的偏好。在这种情况下,在该上下文中的核心研究目标是效率,在找到令人满意的项目之前对所需交互的数量进行评估。这通常是通过对向用户询问的最佳下一个问题的推断来实现。如今,对对话效率的研究几乎完全是经验的,旨在说明,例如,选择问题的一个策略优于给定的应用程序中的另一个策略。通过这项工作,我们将实证研究补充了理论,域名的对话建议的独立模型。该模型旨在涵盖一系列应用方案,使我们能够以正式的方式调查会话方法的效率,特别是关于设计最佳相互作用策略的计算复杂性。通过如此理论分析,我们表明,找到高效的会话策略是NP - 硬,并且在PSPace中,但对于特定类型的目录,上限降低到Polylogspace。从实际的角度来看,该结果意味着目录特征可以强烈影响个人对话策略的效率,因此在设计新策略时应考虑。从真实世界派生的数据集的初步实证分析与我们的研究结果对齐。
translated by 谷歌翻译
The notion of uncertainty is of major importance in machine learning and constitutes a key element of machine learning methodology. In line with the statistical tradition, uncertainty has long been perceived as almost synonymous with standard probability and probabilistic predictions. Yet, due to the steadily increasing relevance of machine learning for practical applications and related issues such as safety requirements, new problems and challenges have recently been identified by machine learning scholars, and these problems may call for new methodological developments. In particular, this includes the importance of distinguishing between (at least) two different types of uncertainty, often referred to as aleatoric and epistemic. In this paper, we provide an introduction to the topic of uncertainty in machine learning as well as an overview of attempts so far at handling uncertainty in general and formalizing this distinction in particular.
translated by 谷歌翻译
We review clustering as an analysis tool and the underlying concepts from an introductory perspective. What is clustering and how can clusterings be realised programmatically? How can data be represented and prepared for a clustering task? And how can clustering results be validated? Connectivity-based versus prototype-based approaches are reflected in the context of several popular methods: single-linkage, spectral embedding, k-means, and Gaussian mixtures are discussed as well as the density-based protocols (H)DBSCAN, Jarvis-Patrick, CommonNN, and density-peaks.
translated by 谷歌翻译
机器学习通常以经典的概率理论为前提,这意味着聚集是基于期望的。现在有多种原因可以激励人们将经典概率理论作为机器学习的数学基础。我们系统地检查了一系列强大而丰富的此类替代品,即各种称为光谱风险度量,Choquet积分或Lorentz规范。我们提出了一系列的表征结果,并演示了使这个光谱家族如此特别的原因。在此过程中,我们证明了所有连贯的风险度量的自然分层,从它们通过利用重新安排不变性Banach空间理论的结果来诱导的上层概率。我们凭经验证明了这种新的不确定性方法如何有助于解决实用的机器学习问题。
translated by 谷歌翻译
超参数优化构成了典型的现代机器学习工作流程的很大一部分。这是由于这样一个事实,即机器学习方法和相应的预处理步骤通常只有在正确调整超参数时就会产生最佳性能。但是在许多应用中,我们不仅有兴趣仅仅为了预测精度而优化ML管道;确定最佳配置时,必须考虑其他指标或约束,从而导致多目标优化问题。由于缺乏知识和用于多目标超参数优化的知识和容易获得的软件实现,因此通常在实践中被忽略。在这项工作中,我们向读者介绍了多个客观超参数优化的基础知识,并激励其在应用ML中的实用性。此外,我们从进化算法和贝叶斯优化的领域提供了现有优化策略的广泛调查。我们说明了MOO在几个特定ML应用中的实用性,考虑了诸如操作条件,预测时间,稀疏,公平,可解释性和鲁棒性之类的目标。
translated by 谷歌翻译
本文介绍了一类称为决策规则的对象,该对象映射了决策空间的替代方案的无限序列。这些对象可用于模拟决策者在接收建议等顺序中遇到替代方案的情况。在决策规则类别中,我们研究自然子类:停止和统一的停止规则。我们的主要结果确定了这两个决策规则的等效性。接下来,我们使用图灵机介绍了决策规则的可计算性概念,并表明可以使用更简单的计算设备实现可计算规则:有限的自动机。我们进一步表明,选择规则的可计算性 - 决策规则的重要子类 - 隐含了它们在自然拓扑方面的连续性。最后,我们在此框架中介绍了一些自然的启发式方法,并提供了其行为表征。
translated by 谷歌翻译
在过去几年的几十年中,致力于更新稳定模型语义(AKA答案设置程序)下更新逻辑计划的问题,或者换句话说,表现出培养结果的问题 - 当它描述更改时,遵守逻辑程序。而最先进的方法是在古典逻辑背景下的相同基本的直觉和愿望被指导,他们基于根本不同的原则和方法,这阻止了可以拥抱两个信念的统一框架规则更新。在本文中,我们将概述与答案设置的编程更新相关的一些主要方法和结果,同时指出本主题研究的一些主要挑战。
translated by 谷歌翻译
参与式预算(PB)最近由于其在社会选择环境中的广泛适用性而引起了很多关注。在本文中,我们认为不可分割的PB涉及将可用的,有限的预算分配给一组不可分割的项目,每个项目都根据代理商而不是项目的偏好而有一定的成本。我们在本文中解决的具体,重要的研究差距是提出针对排名较弱(即弱的顺序偏好)的不可分割的PB规则类别,并研究其关键算法和公理问题。我们提出了两类规则具有不同意义和动力的规则。第一个是分层的批准规则,可以通过将其仔细地转化为批准票来研究弱排名。第二个是基于需求的规则,可以捕获公平性问题。根据分层的批准规则,我们研究了两个自然的规则家庭:贪婪的结局规则和价值价值的规则。该纸有两个部分。在第一部分中,我们研究了拟议规则的算法和复杂性问题。在第二部分中,我们对这些规则进行了详细的公理分析,为此,我们在文献中检查和概括了公理,并引入了新的公理,促销性。该论文有助于强调这些规则的实际吸引力,计算复杂性和公理合规性之间的权衡。
translated by 谷歌翻译
在本文中,我们建立了模糊和优惠语义之间的联系,用于描述逻辑和自组织地图,这些地图已被提出为可能的候选人来解释类别概括的心理机制。特别是,我们表明,在训练之后的自组织地图的输入/输出行为可以通过模糊描述逻辑解释以及基于概念 - 方面的多次方法语义来描述逻辑解释以及考虑偏好的优先解释关于不同的概念,最近提出了排名和加权污染描述逻辑。可以通过模型检查模糊或优先解释来证明网络的属性。从模糊解释开始,我们还为此神经网络模型提供了概率账户。
translated by 谷歌翻译
Virtually all machine learning tasks are characterized using some form of loss function, and "good performance" is typically stated in terms of a sufficiently small average loss, taken over the random draw of test data. While optimizing for performance on average is intuitive, convenient to analyze in theory, and easy to implement in practice, such a choice brings about trade-offs. In this work, we survey and introduce a wide variety of non-traditional criteria used to design and evaluate machine learning algorithms, place the classical paradigm within the proper historical context, and propose a view of learning problems which emphasizes the question of "what makes for a desirable loss distribution?" in place of tacit use of the expected loss.
translated by 谷歌翻译
我们看看两个元素之间的互动所产生的偏好变化:第一个是编码预先存在的态度的初始偏好。第二个元素是来自权威源的新偏好信息信令输入,其可能与初始偏好发生冲突。目的是调整初始偏好并符合新的偏好,而无需放弃比必要的更多信息。我们使用众所周知的AGM方法的形式相信变化的正式机械来模拟这一过程。我们提出了一系列基本合理性假设,并派生了论文的主要结果:一组表示定理,表明根据这些假设的偏好变更可以作为选择函数,以初始偏好顺序的比较指导的选择功能。我们通过展示令我们提出的拟议假设的运营商结束。因此,我们的方法允许我们在较大的信仰变化运营商中偏好修订。
translated by 谷歌翻译
这项工作解决了逆线优化,其中目标是推断线性程序的未知成本向量。具体地,我们考虑数据驱动的设置,其中可用数据是对应于线性程序的不同实例的最佳解决方案的嘈杂的观察。我们介绍了一个问题的新配方,与其他现有方法相比,允许恢复较少的限制性和一般更适当的可允许成本估算。可以表明,该逆优化问题产生有限数量的解决方案,并且我们开发了一个精确的两相算法来确定所有此类解决方案。此外,我们提出了一种有效的分解算法来解决问题的大实例。该算法自然地扩展到在线学习环境,可以用于提供成本估计的快速更新,因为新数据随着时间的推移可用。对于在线设置,我们进一步开发了一种有效的自适应采样策略,指导下一个样本的选择。所提出的方法的功效在涉及两种应用,客户偏好学习和生产计划的成本估算的计算实验中进行了证明。结果表明计算和采样努力的显着减少。
translated by 谷歌翻译