人类群体通常能够找到相互合作的方式,不合时宜的,暂时延长的社会困境。基于行为经济学的模型只能解释这种不现实的无状态矩阵游戏的现象。最近,多智能体强化学习被应用于普遍化社会困境问题,以暂时和空间扩展马尔科夫格。然而,这还没有产生一种能够像人类一样学会合作社会困境的代理人。一个关键的洞察力是,许多(但不是全部)人类个体具有不公平的厌恶社会偏好。这促进了矩阵游戏社会困境的特定解决方案,其中不公平 - 反对个人亲自亲社会并惩罚叛逃者。在这里,我们将这一内容扩展到马尔可夫游戏,并表明它通过与政策性能的有利互动促进了几种类型的顺序社会困境中的合作。特别是,我们发现不公平厌恶改善了跨期社会困境的重要类别的时间信用分配。这些结果有助于解释大规模合作可能如何产生和持续存在。
translated by 谷歌翻译
最近的深度学习方法在语音增强和分离任务方面取得了令人瞩目的成绩然而,这些方法尚未被研究用于分离不同类型的任意声音的混合物,我们称之为通用声音分离的任务,并且未知语音任务的性能是否延续到非语音任务。为了研究这个问题,我们开发了包含任意形式的混合物的通用数据集,并用它来研究基于掩模的分离结构的空间,改变整体网络结构和信号转换的框架分析 - 合成基础。这些网络体系结构包括卷积长期短期记忆网络和时间膨胀卷积栈,其灵感来自最近成功的时间性能增强网络,如ConvTasNet。对于后一种体系结构,我们还提出了新的修改,以进一步提高分离性能。在框架分析 - 合成的基础上,我们使用在TEVasNet中使用的ashort-time傅立叶变换(STFT)或可学习的基础进行探索,并且对于这两个基础,我们检查窗口大小的影响。特别是对于STFT ,我们发现较长的窗口(25-50毫秒)最好的forspeech /非语音分离,而较短的窗口(2.5毫秒)工作最好的任意声音。对于可学习的基础,较短的窗口(2.5毫秒)最适合所有任务。令人惊讶的是,对于通用声音分离,STFT的性能优于基础。我们最好的方法可以改善语音/非语音分离的音阶 - 不变信号与失真比超过13 dB,并且通用声音分离接近10 dB。
translated by 谷歌翻译
Machine learning (ML) techniques are enjoying rapidly increasing adoption. However, designing and implementing the systems that support ML models in real-world deployments remains a significant obstacle, in large part due to the radically different development and deployment profile of modern ML methods, and the range of practical concerns that come with broader adoption. We propose to foster a new systems machine learning research community at the intersection of the traditional systems and ML communities, focused on topics such as hardware systems for ML, software systems for ML, and ML optimized for metrics beyond predictive accuracy. To do this, we describe a new conference, SysML, that explicitly targets research at the intersection of systems and machine learning with a program committee split evenly between experts in systems and ML, and an explicit focus on topics at the intersection of the two.
translated by 谷歌翻译
限制二进制分类问题的最佳可实现错误概率与许多应用程序相关,包括机器学习,信号处理和信息理论。贝叶斯二元分类错误率的许多界限取决于这对类分布之间的信息差异。最近,已提出Henze-Penrose(HP)偏差用于限制分类错误概率。我们考虑经验估计随机样本的HP偏差的问题。我们得出了HL-divergence的Friedman-Rafsky(FR)估计的收敛速度,这与两个分布之间的测试的多变量运行统计有关。 FR估计器源自跨越合并样本的多色欧氏最小生成树(MST)。我们得到了亨兹 - 彭罗斯分歧的弗里德曼 - 拉夫斯基估计的浓度不等式。我们通过实验验证了我们的结果,并说明了它们对真实数据集的应用。
translated by 谷歌翻译
为人类和终端系统建立独特的身份一直是安全社区的一个积极的研究问题,从而产生了基于学习的创新的基于学习的认证技术。尽管这些技术提供了一种建立身份的自动化方法,但它们尚未经过针对其核心机器学习技术的复杂攻击。本文证明了模仿主机指纹识别和生物识别认证系统生成的独特签名是可行的。我们通过构建基于查询合成框架的盲目攻击并利用Explainable-AI(XAI)技术来揭示底层机器学习分类模型的无效性。我们在最先进的面部认证系统中对130个以下的查询进行攻击,在主机认证系统上进行100次以下查询。我们研究了如何防御这些攻击并探索它们的局限性。 XAI为攻击者推断决策边界提供了有效的手段,并为使用机器学习模型进行身份验证的系统构建攻击提供了新的前进方向。
translated by 谷歌翻译
生物医学成像中的肿瘤检测对于医学专业人员来说是一个耗时的过程,并且不是没有错误。因此,近几十年来,研究人员开发了使用各种数学方法进行图像处理的算法技术,例如统计建模,变分技术和机器学习。在本文中,我们提出了一种半自动方法,用于将2D CT扫描分成三个标签,表示基于图形切割的健康,血管或肿瘤组织。首先,我们以一种新颖的方式为每个像素创建一个特征向量,该方式由时间序列数据中的59个强度值组成,并在能量函数中提出简化的周长成本项。我们将函数中的数据和周长项标准化以加快图形切割,而无需优化缩放参数$ \ lambda $。代替训练过程,基于由专业放射科医师识别的样本区域计算预定的组织装置。所提出的方法还具有在计算上实现相对简单的优点。在10个肿瘤的临床CT数据集中对照基础事实进行评估,并产生具有平均Dice相似系数(DSC)为0.77和平均体积重叠误差(VOE)为36.7%的分割。平均处理时间为每片1.25分钟。
translated by 谷歌翻译
全世界每年有超过50万人被诊断患有头颈癌。放射治疗是这种疾病的重要治疗方法,但它需要手动密集描绘危险的放射敏感性(OARs)。这种规划过程可以延迟治疗开始。虽然自动分割算法提供了一种可能省时的解决方案,但定义,量化和实现专家绩效的挑战依然存在。采用深度学习方法,我们展示了一种3D U-Netarchitecture,其性能与专家相似,描绘了大范围的头部和颈部OAR。该模型在常规临床实践中获得的663个鉴定的计算机断层扫描(CT)扫描的数据集上进行训练,并根据共识OAR定义进行分割。我们通过应用于以前未见到该模型的多个国际站点收集的癌症成像档案库提供的24个CT扫描的独立测试集来证明通用性,每个站点由两个独立的专家分组,由21个通常在临床实践中分段的OAR组成。通过适当的验证研究和监管批准,该系统可以提高放疗途径的有效性。
translated by 谷歌翻译
随着医学数据捕获的改进,大量的连续患者监测数据(例如,心电图(ECG),实时生命体征和药物)变得可用于重症监护病房(ICU)的临床决策支持。然而,由于监测数据的高密度,异构数据类型和对可解释模型的要求,对这种数据建模变得越来越具有挑战性。这些高密度监测数据与离散临床事件(包括诊断,药物,实验室)的整合具有挑战性,但可能有所回报,因为此类多模式数据的丰富性和粒度增加了准确检测复杂问题和预测结果(例如,住院时间和死亡率)的可能性)。我们提出循环注意和密集模型(RAIM),用于共同分析连续监测数据和离散临床事件。 RAIM引入了一种用于连续监测数据(例如,ECG)的有效注意机制,其由离散的临床事件(例如,药物使用)引导。我们应用RAIM预测ICU重症患者的生理失代偿和住院时间。通过对MIMIC-III波形数据库匹配子集的评估,我们获得了预测失代偿的AUC-ROC得分为90.18%,使用我们的最终模型得到的预测长度的准确率为86.82%,优于我们的六个基线模型。
translated by 谷歌翻译
高维结构化数据丰富模型描述了共享和每组个体参数的观察组,每个参数具有其自身结构,例如稀疏性或组稀疏性。在本文中,我们考虑数据丰富的一般形式,其中数据来自固定但是任意数量的组G.任何凸函数(例如,规范)都可以表征共享和个体参数的结构。我们提出了一种用于高维数据丰富模型的估计器,并提供了一致地估计共享和个体参数的条件。我们还描述了估计器的示例复杂度,并且对所有参数的估计误差呈现高概率非渐近约束。有趣的是,我们的估算器的样本复杂性转换为每组样本量和样本总数的条件。我们提出了一种具有线性收敛速度的迭代估计算法,并用合成和实际的实验结果补充了我们的理论分析。特别是,我们展示了数据丰富模型的预测能力及其可解释的结果,即药物敏感性分析。
translated by 谷歌翻译
我们使用深度学习来模拟两组或更多组对象之间的交互,例如用户电影评级,蛋白质药物绑定或三元用户 - 项目 - 标签交互。这种交互的规范表示是具有可交换性的矩阵(或更高维的张量):编码的含义不会通过置换行或列来改变。我们认为模型应该是置换等价(PE):限制在这些排列中进行相同的预测。我们提出了一个参数sharingscheme,并证明它不会在没有违反PE的情况下更具表现力。该方案产生三个好处。首先,我们在多个矩阵完成基准测试中展示了最先进的性能。其次,我们的模型需要许多独立于对象数量的参数,因此可以很好地扩展到大型数据集。第三,可以查询模型,在训练时没有可用的新对象,但是已经观察到了哪些交互。在实验中,我们的模型在该矩阵外推任务上实现了令人惊讶的良好的泛化性能,在域内(例如,新用户和从用于训练的相同分布中抽取的新电影)甚至跨域(例如,在电影训练之后预测音乐)。
translated by 谷歌翻译