智能论文笔记

ScanQA: 3D Question Answering for Spatial Scene Understanding

Daichi Azuma , Taiki Miyanishi , Shuhei Kurita , Motoki Kawanabe

分类：计算机视觉

2021-12-20

我们提出了一项新的3D问题答案的3D空间理解任务（3D-QA）。在3D-QA任务中，模型从丰富的RGB-D室内扫描的整个3D场景接收视觉信息，并回答关于3D场景的给定文本问题。与VQA的2D答案不同，传统的2D-QA模型遭受了对对象对齐和方向的空间理解的问题，并且从3D-QA中的文本问题中失败了对象本地化。我们为3D-QA提出了一个名为ScanQA模型的3D-QA基线模型，其中模型从3D对象提案和编码的句子嵌入中获取融合描述符。该学习描述符将语言表达式与3D扫描的底层几何特征相关联，并促进3D边界框的回归以确定文本问题中的描述对象。我们收集了人类编辑的问题答案对，自由表格答案将接地为3D场景中的3D对象。我们的新ScanQA数据集包含来自Scannet DataSet的800个室内场景的超过41K问答对。据我们所知，ScanQA是第一个在3D环境中执行对象接地的问答的大规模工作。

translated by 谷歌翻译

Extension of Convolutional Neural Network along Temporal and Vertical Directions for Precipitation Downscaling

Takeyoshi Nagasato , Kei Ishida , Ali Ercan , Tongbi Tu , Masato Kiyama , Motoki Amagasaki , Kazuki Yokoo

分类：机器学习

2021-12-13

深入学习已被利用气候数据的统计侦查。具体地，已经成功地应用于降水估计的二维（2D）卷积神经网络（CNN）。该研究实现了一种三维（3D）CNN，以估计来自3D大气数据的流域规模的每日降水，并将结果与2D CNN的结果进行比较。沿时间方向（3D-CNN-TIME）和垂直方向（3D-CNN-VERT）延伸2D CNN。将这些扩展CNN的降水估计与第2D CNN的降水估计与根均方误差（RMSE），NASH-SUTCLIFFE效率（NSE）和第99百分位RMSE相比。发现3D-CNN-TIME和3D-CNN-VERT与2D CNN相比提高了降水估计的模型精度。3D-CNN-VERT在RMSE和NSE方面提供了培训和测试期间的最佳估计。

translated by 谷歌翻译

Use of 1D-CNN for input data size reduction of LSTM in Hourly Rainfall-Runoff modeling

Kei Ishida , Ali Ercan , Takeyoshi Nagasato , Masato Kiyama , Motoki Amagasaki

分类：机器学习 | 人工智能

2021-11-07

由一维卷积神经网络（1D-CNN）和长短期存储器（LSTM）网络组成的架构，该架构被提出为CNNSLSTM，用于在此中进行每小时降雨 - 径流模型学习。在CNNSLTSM中，CNN分量在长时间接收小时气象时间序列数据，然后LSTM组件从1D-CNN和小时气象时间序列数据接收提取的特征以进行短期持续时间。以案例研究为例，CNNSLSTM在日本伊希卡里河流域的每小时降雨径流建模。气象数据集由沉淀，空气温度，蒸发散，和长波辐射组成，用作输入，河流流量用作目标数据。为了评估所提出的CNNSLSTM的性能，将CNNSLSTM的结果与1D-CNN，LSTM的结果进行比较，仅用每小时输入（LSTMWHOUT），1D-CNN和LSTM（CNNPLSTM）的并行架构，以及使用每日的LSTM架构每小时输入数据（LSTMWDPH）。与三个传统架构（1D-CNN，LSTMWHOUL和CNNPLSTM）相比，CNNSLSTM对估计准确度明显改进，最近提出了LSTMWDPH。与观察到的流动相比，测试时段的NSE值的中值为0.455-0.469，用于1d-CNN（基于NCHF = 8,16和32，第一层的特征图的信道的数量CNN），用于CNNPLSTM的0.639-0.656（基于NCHF = 8,16和32），LSTMWHOUR的0.745，LSTMWDPH的0.831，CNNSLSTM为0.865-0.873（基于NCHF = 8,16和32）。此外，所提出的CNNSLSTM将1D-CNN的中值降低50.2％-51.4％，CNPLSTM在37.4％-40.8％，LSTMWHOUR，达27.3％-29.5％，LSTMWDPH为10.6％-13.4％。

translated by 谷歌翻译

Capabilities of Deep Learning Models on Learning Physical Relationships: Case of Rainfall-Runoff Modeling with LSTM

Kazuki Yokoo , Kei Ishida , Ali Ercan , Tongbi Tu , Takeyoshi Nagasato , Masato Kiyama , Motoki Amagasaki

分类：机器学习

2021-06-15

本研究调查了深度学习方法可以在输入和输出数据之间识别的关系。作为一个案例研究，选择了通过长期和短期内存（LSTM）网络在雪撬流域中的降雨 - 径流建模。每日沉淀和平均空气温度用作估计日常流量放电的模型输入。在模型培训和验证之后，使用假设输入进行了两个实验模拟，而不是观察到的气象数据，以澄清训练模型对输入的响应。第一个数值实验表明，即使没有输入沉淀，训练有素的模型产生流量放电，特别是冬季低流量和高流量在融雪期间。在没有沉淀的情况下，还通过训练模型复制了暖和较冷的条件对流动放电的影响。此外，该模型仅反映了在总年流量放电的积雪期间的总降水量的17-39％，揭示了强烈缺乏水量保护。本研究的结果表明，深度学习方法可能无法正确学习输入和目标变量之间的显式物理关系，尽管它们仍然能够保持强大的拟合效果。

translated by 谷歌翻译

Multi-Time-Scale Input Approaches for Hourly-Scale Rainfall-Runoff Modeling based on Recurrent Neural Networks

Kei Ishida , Masato Kiyama , Ali Ercan , Motoki Amagasaki , Tongbi Tu

分类：机器学习

2021-01-30

本研究提出了两种直接但有效的方法，以减少通过使用多时间级时间序列数据作为输入通过经常性神经网络（RNN）来计算时间序列建模所需的计算时间。一种方法并行地提供输入时间序列的粗略和精细时间分辨率至RNN。在将它们视为RNN的输入之前，另一个将输入时间序列数据的粗略和精细时间分辨率连接在一起。在这两种方法中，首先，利用更精细的时间分辨率数据来学习目标数据的精细时间尺度行为。接下来，预期较粗糙的时间分辨率数据将捕获输入和目标变量之间的长时间依赖性。通过采用长期和短期记忆（LSTM）网络，在雪撬流域实施时，为每小时降雨 - 径流建模实施，这是一种新型的RNN。随后，使用每日和每小时的气象数据作为输入，并将每小时流量放电视为目标数据。结果证实，两种拟议方法都可以显着降低RNN培训的计算时间（高达32.4次）。此外，提出的方法之一提高了估计准确性。

translated by 谷歌翻译

How to Explain Individual Classification Decisions

David Baehrens , Timon Schroeter , Stefan Harmeling , Motoaki Kawanabe , Katja Hansen , Klaus-Robert Mueller

分类：

2009-12-06

After building a classifier with modern tools of machine learning we typically have a black box at hand that is able to predict well for unseen data. Thus, we get an answer to the question what is the most likely label of a given unseen data point. However, most methods will provide no answer why the model predicted the particular label for a single instance and what features were most influential for that particular instance. The only method that is currently able to provide such explanations are decision trees. This paper proposes a procedure which (based on a set of assumptions) allows to explain the decisions of any classification method.

translated by 谷歌翻译