智能论文笔记

Semi-supervised Fashion Compatibility Prediction by Color Distortion Prediction

Ling Xiao , Toshihiko Yamasaki

分类：计算机视觉

2022-12-27

Supervised learning methods have been suffering from the fact that a large-scale labeled dataset is mandatory, which is difficult to obtain. This has been a more significant issue for fashion compatibility prediction because compatibility aims to capture people's perception of aesthetics, which are sparse and changing. Thus, the labeled dataset may become outdated quickly due to fast fashion. Moreover, labeling the dataset always needs some expert knowledge; at least they should have a good sense of aesthetics. However, there are limited self/semi-supervised learning techniques in this field. In this paper, we propose a general color distortion prediction task forcing the baseline to recognize low-level image information to learn more discriminative representation for fashion compatibility prediction. Specifically, we first propose to distort the image by adjusting the image color balance, contrast, sharpness, and brightness. Then, we propose adding Gaussian noise to the distorted image before passing them to the convolutional neural network (CNN) backbone to learn a probability distribution over all possible distortions. The proposed pretext task is adopted in the state-of-the-art methods in fashion compatibility and shows its effectiveness in improving these methods' ability in extracting better feature representations. Applying the proposed pretext task to the baseline can consistently outperform the original baseline.

translated by 谷歌翻译

Improving Robustness to Out-of-Distribution Data by Frequency-based Augmentation

Koki Mukai , Soichiro Kumano , Toshihiko Yamasaki

分类：计算机视觉

2022-09-06

尽管卷积神经网络（CNN）在图像识别方面具有很高的精度，但它们容易受到对抗性示例和分布数据的影响，并且已经指出了人类识别的差异。为了提高针对分布数据的鲁棒性，我们提出了一种基于频率的数据增强技术，该技术将频率组件用同一类的其他图像替换。当培训数据为CIFAR10并且分发数据的数据为SVHN时，使用该方法训练的模型的接收器操作特征（AUROC）曲线从89.22 \％\％增加到98.15 \％，并进一步增加到98.59\％与另一种数据增强方法结合使用。此外，我们在实验上证明了分布外数据的可靠模型使用图像的许多高频组件。

translated by 谷歌翻译

Prediction of Seismic Intensity Distributions Using Neural Networks

Koyu Mizutani , Haruki Mitarai , Kakeru Miyazaki , Ryugo Shimamura , Soichiro Kumano , Toshihiko Yamasaki

分类：计算机视觉

2022-08-16

地面运动预测方程通常用于预测地震强度分布。但是，将这种方法应用于受地下板结构影响的地震分布并不容易，这通常称为异常地震分布。这项研究提出了使用神经网络进行回归和分类方法的混合体。提出的模型将分布视为二维数据，如图像。我们的方法可以准确预测地震强度分布，甚至异常分布。

translated by 谷歌翻译

SAT: Self-adaptive training for fashion compatibility prediction

Ling Xiao , Toshihiko Yamasaki

分类：计算机视觉

2022-06-25

本文为时尚兼容性预测提供了自适应培训（SAT）模型。它着重于学习一些硬件，例如具有相似颜色，纹理和图案功能的项目，但由于美学或时间变化而被认为是不兼容的。具体而言，我们首先设计了一种定义硬服装的方法，并根据建议为其推荐项目的难度定义并分配了难度分数（DS）（DS）。然后，我们提出了一个自适应三胞胎损失（SATL），其中考虑了服装的DS。最后，我们提出了一个非常简单的条件相似性网络，将提出的SATL结合在一起，以在时尚兼容性预测中学习硬件。公开可用的多货车和多面装备D数据集的实验证明了我们SAT在时尚兼容性预测中的有效性。此外，我们的SATL可以很容易地扩展到其他条件相似性网络以提高其性能。

translated by 谷歌翻译

Superclass Adversarial Attack

Soichiro Kumano , Hiroshi Kera , Toshihiko Yamasaki

分类：计算机视觉

2022-05-29

对抗性攻击只着眼于改变分类器的预测，但是它们的危险在很大程度上取决于班级的错误方式。例如，当自动驾驶系统将波斯猫误认为是暹罗猫时，这几乎不是问题。但是，如果它以120公里/小时的最低速度标志误认为猫，可能会出现严重的问题。作为对更有威胁性的对抗性攻击的垫脚石，我们考虑了超级阶级的对抗性攻击，这不仅会导致不仅级别的班级，而且会导致超类。我们在准确性，速度和稳定性方面对超级类对抗攻击（现有和19种新方法）进行了首次全面分析，并确定了几种实现更好性能的策略。尽管这项研究旨在超类错误分类，但这些发现可以应用于涉及多个类别的其他问题设置，例如TOP-K和多标签分类攻击。

translated by 谷歌翻译

Edge-Level Explanations for Graph Neural Networks by Extending Explainability Methods for Convolutional Neural Networks

Tetsu Kasanishi , Xueting Wang , Toshihiko Yamasaki

分类：机器学习 | 人工智能

2021-11-01

图形神经网络（GNNS）是将图形数据作为输入的深度学习模型，它们应用于各种任务，例如交通预测和分子特性预测。然而，由于GNN的复杂性，难以分析输入的哪些部分影响GNN模型的输出。在本研究中，我们扩展了卷积神经网络（CNNS）的解释方法，例如局部可解释模型 - 不可止结的解释（石灰），基于梯度的显着性图和梯度加权类激活映射（Grad-Cam）到GNN，以及预测输入图中的哪些边对于GNN决策很重要。实验结果表明，基于石灰的方法是最有效的解释性方法，用于多个任务中的现实情况，甚至在GNN解释性中表现出最先进的方法。

translated by 谷歌翻译

Joint Optimization Framework for Learning with Noisy Labels

Daiki Tanaka , Daiki Ikami , Toshihiko Yamasaki , Kiyoharu Aizawa

分类：

2018-03-30

Deep neural networks (DNNs) trained on large-scale datasets have exhibited significant performance in image classification. Many large-scale datasets are collected from websites, however they tend to contain inaccurate labels that are termed as noisy labels. Training on such noisy labeled datasets causes performance degradation because DNNs easily overfit to noisy labels. To overcome this problem, we propose a joint optimization framework of learning DNN parameters and estimating true labels. Our framework can correct labels during training by alternating update of network parameters and labels. We conduct experiments on the noisy CIFAR-10 datasets and the Clothing1M dataset.The results indicate that our approach significantly outperforms other state-of-the-art methods.

translated by 谷歌翻译

MRI-MECH: Mechanics-informed MRI to estimate esophageal health

Sourav Halder , Ethan M. Johnson , Jun Yamasaki , Peter J. Kahrilas , Michael Markl , John E. Pandolfino , Neelesh A. Patankar

分类：机器学习

2022-09-15

动态磁共振成像（MRI）是一种流行的医学成像技术，可生成组织和器官内部对比度材料流动的图像序列。但是，仅在少数可行性研究中证明了它在通过食道运动中的成像运动中的应用，并且相对尚未探索。在这项工作中，我们提出了一个称为力学的MRI（MRI-MEC）的计算框架，该计算框架增强了该能力，从而增加了动态MRI在诊断食管疾病中的适用性。菠萝汁用作动态MRI的吞咽对比材料，MRI图像序列被用作MRI-MECH的输入。 MRI-MECH将食道建模为柔性的一维管，弹性管壁遵循线性管定律。然后，通过一维质量和动量保护方程式，通过食道流动。这些方程是使用物理信息的神经网络（PINN）求解的。 PINN最大程度地减少了MRI测量和模型预测之间的差异，以确保始终遵循流体流量问题的物理。 MRI-Mech计算了食管转运期间的流体速度和压力，并通过计算壁刚度和主动弛豫来估计食道健康的机械健康。此外，MRI-Mech预测了在排空过程中有关下食管下括约肌的缺失信息，这证明了其适用于缺少数据或图像分辨率差的方案。除了基于食管机械健康的定量估计值来改善临床决策外，MRI-MECH还可以增强用于应用其他医学成像方式以增强其功能。

translated by 谷歌翻译

Predicting Parking Lot Availability by Graph-to-Sequence Model: A Case Study with SmartSantander

Yuya Sasaki , Junya Takayama , Juan Ramón Santana , Shohei Yamasaki , Tomoya Okuno , Makoto Onizuka

分类：机器学习

2022-06-21

如今，为了改善服务和城市地区的宜居性，全世界正在进行多个智能城市计划。 SmartSantander是西班牙桑坦德市的一个智能城市项目，该项目依靠无线传感器网络技术在城市内部部署异质传感器，以测量多个参数，包括户外停车信息。在本文中，我们使用SmartSantander的300多个户外停车传感器的历史数据研究了停车场可用性的预测。我们设计了一个图形模型，以捕获停车场的定期波动和地理位置。为了开发和评估我们的模型，我们使用了桑坦德市的3年停车场可用性数据集。与现有的序列到序列模型相比，我们的模型具有很高的精度，该模型足够准确，可以在城市提供停车信息服务。我们将模型应用于智能手机应用程序，以被公民和游客广泛使用。

translated by 谷歌翻译

Esophageal virtual disease landscape using mechanics-informed machine learning

Sourav Halder , Jun Yamasaki , Shashank Acharya , Wenjun Kou , Guy Elisha , Dustin A. Carlson , Peter J. Kahrilas , John E. Pandolfino , Neelesh A. Patankar

分类：机器学习

2021-11-19

食管障碍的发病机制与食管壁力学有关。因此，要了解各种食管障碍背后的潜在基本机制，将基于食管壁力学的参数映射到与改变的推注途径和超级性IBP对应的生理和病理生理学条件至关重要。在这项工作中，我们提出了一种混合框架，将流体力学和机器学习结合，以识别各种食管障碍的底层物理，并将它们映射到我们称之为虚拟疾病景观（VDL）的参数空间上。一维逆模型处理来自食道诊断装置的输出，称为内窥镜功能腔成像探针（endoflip）来估计食道的机械“健康”，通过预测一组基于机械基的参数，例如食道壁刚度，肌肉收缩食管墙的模式和活跃放松。然后使用基于机械基的参数来训练由改变空间（VAE）组成的神经网络，其产生潜在空间和侧面网络，该侧面网络预测用于估计食道古代结动性的机械工作度量。潜在的矢量以及一组基于基于机械的参数定义VDL并形成与各种食管疾病相对应的簇。 VDL不仅区分不同的疾病，而且还可用于预测疾病进展及时。最后，我们还证明了该框架的临床适用性，用于估算治疗后治疗和追踪患者状况的有效性。

translated by 谷歌翻译