智能论文笔记

SHiFT: An Efficient, Flexible Search Engine for Transfer Learning

Cedric Renggli , Xiaozhe Yao , Luka Kolar , Luka Rimanic , Ana Klimovic , Ce Zhang

分类：机器学习

2022-04-04

转移学习可以看作是从头开始的数据和计算效率替代培训模型的替代方法。丰富的模型存储库（例如TensorFlow Hub）的出现使从业人员和研究人员能够在各种下游任务中释放这些模型的潜力。随着这些存储库的成倍增长，有效地为手头任务选择一个好的模型变得至关重要。通过仔细比较各种选择和搜索策略，我们意识到，没有一种方法优于其他方法，而混合或混合策略可以是有益的。因此，我们提出了Shift，这是用于转移学习的第一个下游任务感知，灵活和有效的模型搜索引擎。这些属性由自定义查询语言shift-ql以及基于成本的决策者以及我们经验验证的基于成本的决策者启用。受机器学习开发的迭代性质的促进，我们进一步支持对查询的有效递增执行，这需要与我们的优化共同使用时进行仔细的实施。

translated by 谷歌翻译

Automatic Feasibility Study via Data Quality Analysis for ML: A Case-Study on Label Noise

Cedric Renggli , Luka Rimanic , Luka Kolar , Wentao Wu , Ce Zhang

分类：机器学习

2020-10-16

在我们与正在使用当今汽车系统的领域专家合作的经验中，我们遇到的一个常见问题是我们所说的“不切实际的期望” - 当用户通过嘈杂的数据获取过程面临非常具有挑战性的任务时，同时被期望实现机器学习（ML）的精度非常高。其中许多是从一开始就失败的。在传统的软件工程中，通过可行性研究解决了此问题，这是开发任何软件系统之前必不可少的一步。在本文中，我们介绍了Snoopy，目的是支持数据科学家和机器学习工程师在构建ML应用之前进行系统和理论上建立的可行性研究。我们通过估计基本任务的不可还原错误（也称为贝叶斯错误率（BER））来解决此问题，这源于用于训练或评估ML模型工件的数据集中的数据质量问题。我们设计了一个实用的贝叶斯误差估计器，该估计值与计算机视觉和自然语言处理中的6个数据集（具有不同级别的其他实际和合成噪声）上的基线可行性研究候选者进行了比较。此外，通过将我们的系统可行性研究和其他信号包括在迭代标签清洁过程中，我们在端到端实验中证明了用户如何能够节省大量的标签时间和货币努力。

translated by 谷歌翻译

Fully Stochastic Trust-Region Sequential Quadratic Programming for Equality-Constrained Optimization Problems

Yuchen Fang , Sen Na , Michael W. Mahoney , Mladen Kolar

分类： (统计)机器学习

2022-11-29

We propose a trust-region stochastic sequential quadratic programming algorithm (TR-StoSQP) to solve nonlinear optimization problems with stochastic objectives and deterministic equality constraints. We consider a fully stochastic setting, where in each iteration a single sample is generated to estimate the objective gradient. The algorithm adaptively selects the trust-region radius and, compared to the existing line-search StoSQP schemes, allows us to employ indefinite Hessian matrices (i.e., Hessians without modification) in SQP subproblems. As a trust-region method for constrained optimization, our algorithm needs to address an infeasibility issue -- the linearized equality constraints and trust-region constraints might lead to infeasible SQP subproblems. In this regard, we propose an \textit{adaptive relaxation technique} to compute the trial step that consists of a normal step and a tangential step. To control the lengths of the two steps, we adaptively decompose the trust-region radius into two segments based on the proportions of the feasibility and optimality residuals to the full KKT residual. The normal step has a closed form, while the tangential step is solved from a trust-region subproblem, to which a solution ensuring the Cauchy reduction is sufficient for our study. We establish the global almost sure convergence guarantee for TR-StoSQP, and illustrate its empirical performance on both a subset of problems in the CUTEst test set and constrained logistic regression problems using data from the LIBSVM collection.

translated by 谷歌翻译

Reconstruction and analysis of negatively buoyant jets with interpretable machine learning

Marta Alvir , Luka Grbčić , Ante Sikirica , Lado Kranjčević

分类：机器学习 | (统计)机器学习

2022-11-10

In this paper, negatively inclined buoyant jets, which appear during the discharge of wastewater from processes such as desalination, are observed. To minimize harmful effects and assess environmental impact, a detailed numerical investigation is necessary. The selection of appropriate geometry and working conditions for minimizing such effects often requires numerous experiments and numerical simulations. For this reason, the application of machine learning models is proposed. Several models including Support Vector Regression, Artificial Neural Networks, Random Forests, XGBoost, CatBoost and LightGBM were trained. The dataset was built with numerous OpenFOAM simulations, which were validated by experimental data from previous research. The best prediction was obtained by Artificial Neural Network with an average of R2 0.98 and RMSE 0.28. In order to understand the working of the machine learning model and the influence of all parameters on the geometrical characteristics of inclined buoyant jets, the SHAP feature interpretation method was used.

translated by 谷歌翻译

Active Learning and Approximate Model Calibration for Automated Visual Inspection in Manufacturing

Jože M. Rožanec , Luka Bizjak , Elena Trajkova , Patrik Zajec , Jelle Keizer , Blaž Fortuna , Dunja Mladenić

分类：机器学习 | 人工智能 | 计算机视觉

2022-09-12

质量控制是制造业企业进行的至关重要的活动，以确保其产品符合质量标准并避免对品牌声誉的潜在损害。传感器成本下降和连接性使制造业数字化增加。此外，人工智能可实现更高的自动化程度，减少缺陷检查所需的总体成本和时间。这项研究将三种活跃的学习方法（与单一和多个牙齿）与视觉检查进行了比较。我们提出了一种新颖的方法，用于对分类模型的概率校准和两个新的指标，以评估校准的性能而无需地面真相。我们对飞利浦消费者生活方式BV提供的现实数据进行了实验。我们的结果表明，考虑到p = 0.95的阈值，探索的主动学习设置可以将数据标签的工作减少3％至4％，而不会损害总体质量目标。此外，我们表明所提出的指标成功捕获了相关信息，否则仅通过地面真实数据最适合使用的指标可用。因此，所提出的指标可用于估计模型概率校准的质量，而无需进行标签努力以获取地面真相数据。

translated by 谷歌翻译

Machine learning based surrogate models for microchannel heat sink optimization

Ante Sikirica , Luka Grbčić , Lado Kranjčević

分类：机器学习

2022-08-20

在本文中，使用计算流体动力学研究了具有次级通道和肋骨的微通道设计，并与多目标优化算法耦合，以确定并提出基于观察到的热阻力和泵送功率的最佳溶液。提出了一种结合拉丁超立方体采样，基于机器学习的替代建模和多目标优化的工作流程。在寻找最佳替代物期间，考虑了随机森林，梯度增强算法和神经网络。我们证明了调整的神经网络可以做出准确的预测，并用于创建可接受的替代模型。与常规优化方法相比，优化解决方案在总体性能上显示出可忽略的差异。此外，解决方案是在原始时间的五分之一中计算的。在与对流微通道设计相同的压力极限下，生成的设计达到的温度低于10％以上。当受到温度的限制时，压降降低了25％以上。最后，通过采用Shapley添加说明技术研究了每个设计变量对热电阻和泵送功率的影响。总体而言，我们已经证明了所提出的框架具有优点，可以用作微通道散热器设计优化的可行方法。

translated by 谷歌翻译

Model Predictive Impedance Control with Gaussian Processes for Human and Environment Interaction

Kevin Haninger , Christian Hegeler , Luka Peternel

分类：机器人

2022-08-15

在目标或配置在迭代之间变化的任务中，人机交互（HRI）可以使机器人能够处理可重复的方面，并提供适合当前状态的信息。当前，通过推断人类目标或为了适应机器人阻抗，目前可以实现先进的交互式机器人行为。尽管已经提出了许多针对互动机器人行为的应用程序特定的启发式方法，但它们通常受到范围的限制，例如仅考虑人体工程学或任务绩效。为了提高普遍性，本文提出了一个框架，该框架既计划在线轨迹和阻抗，处理任务和人类目标的混合，并可以有效地应用于新任务。该框架可以考虑多种类型的不确定性：接触约束变化，人类目标的不确定性或任务障碍。不确定性感知的任务模型是从使用高斯流程的一些演示中学到的。该任务模型用于非线性模型预测控制（MPC）问题，以根据对离散人类目标，人运动学，安全限制，接触稳定性和频率障碍抑制的信念来优化机器人轨迹和阻抗。引入了此MPC公式，对凸度进行了分析，并通过多个目标，协作抛光任务和协作组装任务进行了验证。

translated by 谷歌翻译

A Reference Data Model for Process-Related User Interaction Logs

Luka Abb , Jana-Rebecca Rehse

分类：人工智能

2022-07-25

用户交互（UI）日志是高分辨率事件日志，在信息系统中执行任务期间，用户执行的低级活动记录了低级活动。 UI日志中的每个事件都对应于用户和接口之间的单个交互，例如单击按钮或将字符串输入文本字段。 UI日志用于诸如任务挖掘或机器人过程自动化（RPA）之类的目的，但是每个研究和工具都依赖于构成用户交互的元素和属性的不同概念化和实现。缺乏标准化使得很难整合来自不同来源的UI日志，并将UI数据收集工具与下游分析或自动化解决方案相结合。为了解决这个问题，我们为与过程相关的UI日志提出了一个普遍适用的参考数据模型。基于对科学文献和行业解决方案的综述，该模型包括UI日志的核心属性，但在范围，抽象水平和案例概念方面仍然灵活。我们提供该模型的实现，以扩展事件日志的XES互换标准，并在现实生活中的RPA方案中演示其实际适用性。

translated by 谷歌翻译

Few-shot incremental learning in the context of solar cell quality inspection

Julen Balzategui , Luka Eciolaza

分类：计算机视觉 | 机器学习

2022-07-01

在行业中，深度神经网络显示出高缺陷检测率，超过了其他基于手动特征工程的其他更为传统的建议。这主要是通过监督培训来实现的，在该培训中，需要大量数据才能学习良好的分类模型。但是，在工业场景中，有时很难获得这样的数据，因为通常会产生有缺陷的零件。此外，某些类型的缺陷非常罕见，通常只是不时出现，这使得生成适当的数据集来训练分类模型。此外，缺乏可用数据将检查模型的适应性限制为出现在生产中的新缺陷类型，因为它可能需要进行模型再培训才能合并检测并检测到它们。在这项工作中，我们在太阳能电池质量检查的背景下探索了重量印记的技术，在该方面，我们已经在三个基本缺陷类别上训练了网络，然后我们使用了很少的样本合并了新的缺陷类。结果表明，该技术使网络可以扩展其关于几个样本的缺陷类别的知识，这对于工业从业者来说可能很有趣。

translated by 谷歌翻译

Analysis of Randomization Effects on Sim2Real Transfer in Reinforcement Learning for Robotic Manipulation Tasks

Josip Josifovski , Mohammadhossein Malmir , Noah Klarmann , Bare Luka Žagar , Nicolás Navarro-Guerrero , Alois Knoll

分类：机器人 | 人工智能

2022-06-13

当前，随机化是用于机器人技术中数据驱动的学习算法的SIM2REAL传输中广泛使用的方法。尽管如此，大多数SIM2REAL研究报告了特定随机技术的结果，并且通常是在高度定制的机器人系统上，因此很难系统地评估不同的随机方法。为了解决这个问题，我们为机器人触及余量操纵器任务定义了易于制作的实验设置，该设置可以作为比较的基准。我们将四个随机策略与模拟和真实机器人中的三个随机参数进行比较。我们的结果表明，更多的随机化有助于SIM2REAL转移，但它也可能损害算法在模拟中找到良好策略的能力。完全随机的仿真和微调显示出差异化的结果，并且比测试的其他方法更好地转化为实际机器人。

translated by 谷歌翻译