智能论文笔记

即使在实践中无法计算其可能性，基于模拟的推断也能够学习模型的参数。一类方法使用用不同参数模拟的数据来推断摊销估计器，以获得似然到证据比，或等效的后函数。我们表明，可以在模型参数和模拟数据之间的相互信息最大化方面配制这种方法。我们使用此等价来重新诠释摊销推理的现有方法，并提出了两种依赖于互信息的下限的新方法。我们使用人工神经网络用于后部预测的采样轨迹，将框架应用于随机过程和混沌动态系统的推动。我们的方法提供了一个统一的框架，利用了相互信息估计的功率进行推理。

translated by 谷歌翻译

本文通过研究阶段转换的$ Q $State Potts模型，通过许多无监督的机器学习技术，即主成分分析（PCA），$ K $ - 梅尔集群，统一歧管近似和投影（UMAP），和拓扑数据分析（TDA）。即使在所有情况下，我们都能够检索正确的临界温度$ t_c（q）$，以$ q = 3,4 $和5 $，结果表明，作为UMAP和TDA的非线性方法依赖于有限尺寸效果，同时仍然能够区分第一和二阶相转换。该研究可以被认为是在研究相转变的调查中使用不同无监督的机器学习算法的基准。

translated by 谷歌翻译

Statistical quantification of confounding bias in predictive modelling

Tamas Spisak

分类：机器学习 | (统计)机器学习

2021-11-01

对混淆偏差的缺乏非参数统计测试显着妨碍了在许多研究领域的强大，有效和更广泛的预测模型的开发。在这里，我提出了部分和完整的混淆测试，对于给定的混淆变量，分别探测了unconfound和完全混淆的模型的零假设。测试为I型错误和高统计功率提供了严格控制，即使对于非正常和非线性依赖预测，通常可以在机器学习中看到。应用拟议的测试对来自人类联系项目的功能性大脑连接数据培训的模型和自闭症脑成像数据交换数据集显示出以前未报告或发现难以纠正的混淆，以便在最先进的混乱缓解方法。在Package MLConfound（https://mlconfound.readthedocs.io）中实施的测试可以帮助评估和改进预测模型的概括性和神经生物学有效性，从而促进临床有用的机器学习生物标志物的发展。

translated by 谷歌翻译

本文探讨了超线性增长趋势的环境影响，从整体角度来看，跨越数据，算法和系统硬件。我们通过在行业规模机器学习用例中检查模型开发周期来表征AI计算的碳足迹，同时考虑系统硬件的生命周期。进一步迈出一步，我们捕获AI计算的操作和制造碳足迹，并为硬件 - 软件设计和尺度优化的结束分析以及如何帮助降低AI的整体碳足迹。根据行业经验和经验教训，我们分享关键挑战，并在AI的许多方面上绘制了重要的发展方向。我们希望本文提出的关键信息和见解能够激发社区以环保的方式推进AI领域。

translated by 谷歌翻译