本文报告了在固体表面上溅出的滴滴和时间演化的特征,这些特征是通过图像序列分类提取的,使用高度可解释的前馈神经网络(FNN),其隐藏层为零。用于训练验证和测试FNN的图像序列显示了毫米大小的乙醇滴的早期变形,这些乙醇液滴会影响亲水性玻璃基材,Weber数量范围为31-474(溅出阈值约为173)。进行特定的摄像条件和数字图像处理,以确保图像序列之间的高相似性。结果,受过训练的FNN的测试精度高于96%。值得注意的是,该特征提取表明,受过训练的FNN鉴定出空气动力学上升起的二滴液滴的时间演变,而主体的相对较高的轮廓是溅出的特征,而相对较短的薄片则是相对较短而厚的薄片。非挡板滴的功能。除了溅到和非挡块滴剂之间主体的轮廓高度的差异外,已经确定了这些特征的物理解释及其各自的时间进化。这项研究中报道的观察结果对于开发数据驱动的模拟很重要,以建模对固体表面撞击期间溅出的滴落变形。
translated by 谷歌翻译
我们设计了一种机器学习技术,解决了从湍流观察中推断出物理参数的一般问题,许多理论和应用领域的相关运动,从工程到地球观察和天体物理学。我们的方法是训练机器学习系统以从3D域中提取的2D平面上的流速的速度幅度观察流量的参考帧的旋转频率。机器学习方法包括在计算机视觉中开发的同类的深度卷积神经网络(DCNN)组成。培训和验证数据集是通过完全解决的直接数值模拟生产的。这项研究显示出两种不同观点的有趣结果。从机器学习的角度来看,它显示了DCNN的潜力,在这种特别复杂的问题上达到了良好的效果,越来越远的人类视力的极限。其次,从物理学的角度来看,它提供了一个关于如何在数据分析中开发机器学习的示例,以便以其他方式推断出可接近的信息。实际上,通过将DCNN与其他可能的贝叶斯方法进行比较,我们发现DCNN在所有检查的病例中产生了更高的推理准确性。
translated by 谷歌翻译
了解极端事件及其可能性是研究气候变化影响,风险评估,适应和保护生物的关键。在这项工作中,我们开发了一种方法来构建极端热浪的预测模型。这些模型基于卷积神经网络,对极长的8,000年气候模型输出进行了培训。由于极端事件之间的关系本质上是概率的,因此我们强调概率预测和验证。我们证明,深度神经网络适用于法国持续持续14天的热浪,快速动态驱动器提前15天(500 hpa地球电位高度场),并且在慢速较长的交货时间内,慢速物理时间驱动器(土壤水分)。该方法很容易实现和通用。我们发现,深神经网络选择了与北半球波数字3模式相关的极端热浪。我们发现,当将2米温度场添加到500 HPA地球电位高度和土壤水分场中时,2米温度场不包含任何新的有用统计信息。主要的科学信息是,训练深层神经网络预测极端热浪的发生是在严重缺乏数据的情况下发生的。我们建议大多数其他应用在大规模的大气和气候现象中都是如此。我们讨论了处理缺乏数据制度的观点,例如罕见的事件模拟,以及转移学习如何在后一种任务中发挥作用。
translated by 谷歌翻译
传统上,基于标度律维模型已被用于参数对流换热岩类地行星像地球,火星,水星和金星的内部,以解决二维或三维高保真前插的计算瓶颈。然而,这些在物理它们可以建模(例如深度取决于材料特性),并预测只平均量的量的限制,例如平均温度地幔。我们最近发现,前馈神经网络(FNN),使用了大量的二维模拟可以克服这个限制和可靠地预测整个1D横向平均温度分布的演变,及时为复杂的模型训练。我们现在扩展该方法以预测的完整2D温度字段,它包含在对流结构如热羽状和冷downwellings的形式的信息。使用的地幔热演化的10,525二维模拟数据集火星般的星球,我们表明,深度学习技术能够产生可靠的参数代理人(即代理人即预测仅基于参数状态变量,如温度)底层偏微分方程。我们首先使用卷积自动编码由142倍以压缩温度场,然后使用FNN和长短期存储器网络(LSTM)来预测所述压缩字段。平均起来,FNN预测是99.30%,并且LSTM预测是准确相对于看不见模拟99.22%。在LSTM和FNN预测显示,尽管较低的绝对平均相对精度,LSTMs捕捉血流动力学优于FNNS适当的正交分解(POD)。当求和,从FNN预测和从LSTM预测量至96.51%,相对97.66%到原始模拟的系数,分别与POD系数。
translated by 谷歌翻译
面部情感识别是识别心理学用来诊断患者的重要工具之一。面部和面部情感识别是机器学习卓越的领域。由于不同的环境,例如照明条件,姿势变化,偏航运动和遮挡,面部情绪识别是对数字图像处理的开放挑战。深度学习方法已显示出图像识别的显着改善。但是,准确性和时间仍然需要改进。这项研究旨在在训练期间提高面部情绪识别的准确性,并使用Extreme Learning Machine(CNNeelm)增强的修改后的卷积神经网络减少处理时间。该系统需要(CNNeelm)提高培训期间图像注册的准确性。此外,该系统通过拟议的CNNeelm模型认识到六种面部情绪快乐,悲伤,厌恶,恐惧,惊喜和中立。研究表明,与经过改进的随机梯度下降(SGD)技术相比,总体面部情绪识别精度的提高了2%。借助Extreme Learning Machine(ELM)分类器,处理时间从113ms中降至65ms,可以从20fps的视频剪辑中平滑地对每个帧进行分类。使用预先训练的InceptionV3模型,建议使用JAFFE,CK+和FER2013表达数据集训练所提出的CNNeelm模型。仿真结果显示出准确性和处理时间的显着改善,使该模型适合视频分析过程。此外,该研究解决了处理面部图像所需的大量处理时间的问题。
translated by 谷歌翻译
这是一门专门针对STEM学生开发的介绍性机器学习课程。我们的目标是为有兴趣的读者提供基础知识,以在自己的项目中使用机器学习,并将自己熟悉术语作为进一步阅读相关文献的基础。在这些讲义中,我们讨论受监督,无监督和强化学习。注释从没有神经网络的机器学习方法的说明开始,例如原理分析,T-SNE,聚类以及线性回归和线性分类器。我们继续介绍基本和先进的神经网络结构,例如密集的进料和常规神经网络,经常性的神经网络,受限的玻尔兹曼机器,(变性)自动编码器,生成的对抗性网络。讨论了潜在空间表示的解释性问题,并使用梦和对抗性攻击的例子。最后一部分致力于加强学习,我们在其中介绍了价值功能和政策学习的基本概念。
translated by 谷歌翻译
机器学习模型在几个研究领域的预测任务中发挥着至关重要的作用。在这项工作中,我们利用机器学习算法的能力来预测非线性机械系统中的极端事件的发生。极端事件是罕见的事件,普遍存在的本质上。我们考虑四台机器学习模型,即Logistic回归,支持向量机,随机森林和我们预测任务中的多层射击。我们使用Test Set Data培训训练集数据培训这四种机器学习模型,并计算每个型号的性能。我们表明,多层的Perceptron模型在考虑系统中的极端事件预测中的四种模型中表现得更好。考虑机器学习模型的持久性行为与随机播放的训练集和测试集数据交叉检查。
translated by 谷歌翻译
尽管他们取得了巨大的成功,但由于缺乏解释性,神经网络仍然是黑盒。在这里,我们提出了一种新的分析方法,即重量途径分析(WPA),以使其透明。我们将重量从输入神经元纵向连接到输出神经元或简单的权重途径的途径中,是理解神经网络的基本单元,并将神经网络分解为此类权重途径的一系列子网络。提出了子网的可视化方案,该方案给出了网络的纵向观点,例如X光片,使网络的内部结构可见。参数调整或网络的结构变化的影响可以通过此类X光片可视化。为子网络建立了特征图,以表征输入样品对每个输出神经元的影响的增强或抑制。使用WPA,我们发现神经网络存储并以全息方式使用信息,也就是说,子网编码在连贯结构中的所有训练样本,因此只有通过研究重量途径才能探索存储在网络中的样品。此外,使用WPA,我们揭示了神经网络的基本学习模式:线性学习模式和非线性学习模式。前者提取了线性可分离的特征,而后者提取了线性不可分割的特征。隐藏的层神经元自组织分为不同的类,以建立学习模式并实现培训目标。学习模式的发现为我们提供了理解机器学习的一些基本问题的理论基础,例如学习过程的动态,线性和非线性神经元的作用以及网络宽度和深度的作用。
translated by 谷歌翻译
在热分析和低温热交换器的几何设计过程中,强迫沸腾现象的准确降低估计很重要。但是,当前预测压降的方法存在两个问题之一:缺乏对不同情况的准确性或概括。在这项工作中,我们介绍了相关的信息神经网络(COINN),这是应用人工神经网络(ANN)技术的新范式,结合了成功的压降相关性,作为预测微质混合压力下降的绘制工具 - 通道。所提出的方法是受转移学习的启发,该方法在减少数据集的深度学习问题中高度使用。我们的方法通过将Sun&Mishima相关性的知识传递给ANN来提高ANN的性能。具有物理和现象学对微通道压力下降的相关性大大提高了ANN的性能和概括能力。最终结构由三个输入组成:混合蒸气质量,微通道内径和可用的压降相关性。结果表明,使用相关的信息方法获得的好处预测用于训练的实验数据和后验测试,平均相对误差(MRE)为6%,低于Sun&Mishima相关性13%。此外,这种方法可以扩展到其他混合物和实验设置,这是使用ANN用于传热应用的其他方法中的缺少特征。
translated by 谷歌翻译
模式形成过程中拓扑和微观结构方案中过渡的识别和分类对于理解和制造许多应用领域中的微观结构精确的新型材料至关重要。不幸的是,相关的微观结构过渡可能取决于以微妙而复杂的方式取决于过程参数,而经典相变理论未捕获。尽管有监督的机器学习方法可能对识别过渡制度很有用,但他们需要标签,这些标签需要先验了解订单参数或描述这些过渡的相关结构。由动态系统的通用原理的激励,我们使用一种自我监督的方法来解决使用神经网络从观察到的微观结构中预测过程参数的反问题。这种方法不需要关于不同类别的微观结构模式或预测微观结构过渡的目标任务的预定义的,标记的数据。我们表明,执行逆问题预测任务的困难与发现微观结构制度的目标有关,因为微观结构模式的定性变化与我们自我监督问题的不确定性预测的变化相对应。我们通过在两个不同的模式形成过程中自动发现微观结构方案中的过渡来证明我们的方法的价值:两相混合物的旋律分解以及在薄膜物理蒸气沉积过程中二进制合金浓度调制的形成。这种方法为发现和理解看不见的或难以辨认的过渡制度开辟了一个有希望的途径,并最终用于控制复杂的模式形成过程。
translated by 谷歌翻译
要使用深神经网络预测罕见的极端事件,一个人遇到所谓的小数据问题,因为即使是长期观测通常常见的事件常见。在这里,我们研究了一种模型辅助框架,其中训练数据是从数值模拟获得的,而不是观察,具有来自极端事件的适当样本。但是,为了确保培训的网络在实践中适用,无法在完整的仿真数据上执行培训;相反,我们只使用可以在实践中测量的可观察量的小子集。我们调查这一模型辅助框架在三种不同动力系统(Rossler Larguger Or,Fitzhugh - Nagumo Model和湍流流体流量)和三种不同的深神经网络架构(前馈,长短期内存和储层计算)上的可行性)。在每种情况下,我们研究了预测准确性,稳健性对噪声,重复训练的再现性,以及对输入数据类型的敏感性。特别是,我们发现长期的短期内存网络是最强大的噪声,并产生相对准确的预测,同时需要最小的高考的微调。
translated by 谷歌翻译
手写数字识别(HDR)是光学特征识别(OCR)领域中最具挑战性的任务之一。不管语言如何,HDR都存在一些固有的挑战,这主要是由于个人跨个人的写作风格的变化,编写媒介和环境的变化,无法在反复编写任何数字等时保持相同的笔触。除此之外,特定语言数字的结构复杂性可能会导致HDR的模棱两可。多年来,研究人员开发了许多离线和在线HDR管道,其中不同的图像处理技术与传统的机器学习(ML)基于基于的和/或基于深度学习(DL)的体系结构相结合。尽管文献中存在有关HDR的广泛审查研究的证据,例如:英语,阿拉伯语,印度,法尔西,中文等,但几乎没有对孟加拉人HDR(BHDR)的调查,这缺乏对孟加拉语HDR(BHDR)的研究,而这些调查缺乏对孟加拉语HDR(BHDR)的研究。挑战,基础识别过程以及可能的未来方向。在本文中,已经分析了孟加拉语手写数字的特征和固有的歧义,以及二十年来最先进的数据集的全面见解和离线BHDR的方法。此外,还详细讨论了一些涉及BHDR的现实应用特定研究。本文还将作为对离线BHDR背后科学感兴趣的研究人员的汇编,煽动了对相关研究的新途径的探索,这可能会进一步导致在不同应用领域对孟加拉语手写数字进行更好的离线认识。
translated by 谷歌翻译
This work presents a set of neural network (NN) models specifically designed for accurate and efficient fluid dynamics forecasting. In this work, we show how neural networks training can be improved by reducing data complexity through a modal decomposition technique called higher order dynamic mode decomposition (HODMD), which identifies the main structures inside flow dynamics and reconstructs the original flow using only these main structures. This reconstruction has the same number of samples and spatial dimension as the original flow, but with a less complex dynamics and preserving its main features. We also show the low computational cost required by the proposed NN models, both in their training and inference phases. The core idea of this work is to test the limits of applicability of deep learning models to data forecasting in complex fluid dynamics problems. Generalization capabilities of the models are demonstrated by using the same neural network architectures to forecast the future dynamics of four different multi-phase flows. Data sets used to train and test these deep learning models come from Direct Numerical Simulations (DNS) of these flows.
translated by 谷歌翻译
Current learning machines have successfully solved hard application problems, reaching high accuracy and displaying seemingly "intelligent" behavior. Here we apply recent techniques for explaining decisions of state-of-the-art learning machines and analyze various tasks from computer vision and arcade games. This showcases a spectrum of problem-solving behaviors ranging from naive and short-sighted, to wellinformed and strategic. We observe that standard performance evaluation metrics can be oblivious to distinguishing these diverse problem solving behaviors. Furthermore, we propose our semi-automated Spectral Relevance Analysis that provides a practically effective way of characterizing and validating the behavior of nonlinear learning machines. This helps to assess whether a learned model indeed delivers reliably for the problem that it was conceived for. Furthermore, our work intends to add a voice of caution to the ongoing excitement about machine intelligence and pledges to evaluate and judge some of these recent successes in a more nuanced manner.
translated by 谷歌翻译
视觉的触觉传感器由于经济实惠的高分辨率摄像机和成功的计算机视觉技术而被出现为机器人触摸的有希望的方法。但是,它们的物理设计和他们提供的信息尚不符合真实应用的要求。我们提供了一种名为Insight的强大,柔软,低成本,视觉拇指大小的3D触觉传感器:它不断在其整个圆锥形感测表面上提供定向力分布图。围绕内部单眼相机构造,传感器仅在刚性框架上仅成型一层弹性体,以保证灵敏度,鲁棒性和软接触。此外,Insight是第一个使用准直器将光度立体声和结构光混合的系统来检测其易于更换柔性外壳的3D变形。通过将图像映射到3D接触力的空间分布(正常和剪切)的深神经网络推断力信息。洞察力在0.4毫米的总空间分辨率,力量幅度精度约为0.03 n,并且对于具有不同接触面积的多个不同触点,在0.03-2 n的范围内的5度大约5度的力方向精度。呈现的硬件和软件设计概念可以转移到各种机器人部件。
translated by 谷歌翻译
The International Workshop on Reading Music Systems (WoRMS) is a workshop that tries to connect researchers who develop systems for reading music, such as in the field of Optical Music Recognition, with other researchers and practitioners that could benefit from such systems, like librarians or musicologists. The relevant topics of interest for the workshop include, but are not limited to: Music reading systems; Optical music recognition; Datasets and performance evaluation; Image processing on music scores; Writer identification; Authoring, editing, storing and presentation systems for music scores; Multi-modal systems; Novel input-methods for music to produce written music; Web-based Music Information Retrieval services; Applications and projects; Use-cases related to written music. These are the proceedings of the 3rd International Workshop on Reading Music Systems, held in Alicante on the 23rd of July 2021.
translated by 谷歌翻译
血流特征的预测对于了解血液动脉网络的行为至关重要,特别是在血管疾病(如狭窄)的存在下。计算流体动力学(CFD)提供了一种强大而有效的工具,可以确定包括网络内的压力和速度字段的这些特征。尽管该领域有许多研究,但CFD的极高计算成本导致研究人员开发新的平台,包括机器学习方法,而是以更低的成本提供更快的分析。在这项研究中,我们提出了一个深度神经网络框架,以预测冠状动脉网络中的流动行为,在存在像狭窄等异常存在下具有不同的性质。为此,使用合成数据训练人工神经网络(ANN)模型,使得它可以预测动脉网络内的压力和速度。培训神经网络所需的数据是从ABAQUS软件的特定特征的次数的CFD分析中获得了培训神经网络的数据。狭窄引起的血压下降,这是诊断心脏病诊断中最重要的因素之一,可以使用我们所提出的模型来了解冠状动脉的任何部分的几何和流动边界条件。使用Lad血管的三个实际几何形状来验证模型的效率。所提出的方法精确地预测了血流量的血流动力学行为。压力预测的平均精度为98.7%,平均速度幅度精度为93.2%。根据测试三个患者特定几何形状的模型的结果,模型可以被认为是有限元方法的替代方案以及其他难以实现的耗时数值模拟。
translated by 谷歌翻译
基于学习的视觉自我运动估计是有希望的,但尚未准备好在现实世界中浏览敏捷的移动机器人。在本文中,我们提出了Cuahn-Vio,这是一款适用于配备了向下式摄像头的微型航空车(MAVS)的强大而有效的单眼视觉惯性镜(VIO)。视觉前端是一个内容和不确定性的同型同构网络(CUAHN),它对非主体摄影图像内容和网络预测的故障案例非常有力。它不仅可以预测截然变换,还可以估计其不确定性。培训是自学的,因此它不需要通常难以获得的地面真理。该网络具有良好的概括,可以在不进行微调的情况下在新环境中部署“插件”。轻巧的扩展卡尔曼过滤器(EKF)用作VIO后端,并利用网络中的平均预测和方差估计进行视觉测量更新。 Cuahn-Vio在高速公共数据集上进行了评估,并显示出与最先进(SOTA)VIO方法的竞争精度。由于运动模糊,低网络推理时间(〜23ms)和稳定的处理延迟(〜26ms),Cuahn-Vio成功运行了NVIDIA JETSON TX2嵌入式处理器,以导航快速自动驾驶MAV。
translated by 谷歌翻译
The occurrence of vacuum arcs or radio frequency (rf) breakdowns is one of the most prevalent factors limiting the high-gradient performance of normal conducting rf cavities in particle accelerators. In this paper, we search for the existence of previously unrecognized features related to the incidence of rf breakdowns by applying a machine learning strategy to high-gradient cavity data from CERN's test stand for the Compact Linear Collider (CLIC). By interpreting the parameters of the learned models with explainable artificial intelligence (AI), we reverse-engineer physical properties for deriving fast, reliable, and simple rule-based models. Based on 6 months of historical data and dedicated experiments, our models show fractions of data with a high influence on the occurrence of breakdowns. Specifically, it is shown that the field emitted current following an initial breakdown is closely related to the probability of another breakdown occurring shortly thereafter. Results also indicate that the cavity pressure should be monitored with increased temporal resolution in future experiments, to further explore the vacuum activity associated with breakdowns.
translated by 谷歌翻译
在现代建筑基础设施中,由于低成本传感器的大数据可用性以及深度学习等先进的建模工具,因此促进自适应和无监督的数据驱动的健康监测系统的机会正在受欢迎。本文的主要目的是将深度神经网络与双向短期内存结合和涉及瞬时频率和光谱峰度的先进统计分析,以开发出来自声发射事件(裂缝)的拉伸,剪切和混合模式的准确分类工具。我们调查了有效的事件描述符,以捕获不同类型模式的独特特征。实验结果的测试证实,该方法在不同的破解事件中实现了有希望的分类,并可能影响结构健康监测(SHM)技术的未来设计。这种方法有效地对初始损害进行分类,以92%的精度进行分类,这是有利的计划维护。
translated by 谷歌翻译