智能论文笔记

Large-Scale Traffic Congestion Prediction based on Multimodal Fusion and Representation Mapping

Bodong Zhou , Jiahui Liu , Songyi Cui , Yaping Zhao

分类：机器学习

2022-08-23

随着城市化过程的进步，城市运输系统对于城市的发展和公民的生活质量至关重要。其中，它是通过分析交通拥堵因素来判断交通拥堵的最重要任务之一。最近，引入了各种传统和基于机器的基于机器的模型，以预测交通拥堵。但是，这些模型要么在大规模的拥塞因素上汇集不佳，要么无法对大规模空间中每个精确的位置做出准确的预测。为了减轻这些问题，本文提出了一个基于卷积神经网络的新型端到端框架。通过学习表示，该框架提出了一个新颖的多模式融合模块和一个新颖的表示模块，以在大规模地图上在任意查询位置上实现交通拥堵预测，并结合各种全局参考信息。所提出的框架可在现实世界大规模数据集上取得重大结果和有效的推断。

translated by 谷歌翻译

Spatial-Temporal Feature Extraction and Evaluation Network for Citywide Traffic Condition Prediction

Shilin Pu , Liang Chu , Zhuoran Hou , Jincheng Hu , Yanjun Huang , Yuanjian Zhang

分类：机器学习

2022-07-22

流量预测在智能运输系统中交通控制和调度任务的实现中起着重要作用。随着数据源的多元化，合理地使用丰富的流量数据来对流量流中复杂的时空依赖性和非线性特征进行建模是智能运输系统的关键挑战。此外，清楚地评估从不同数据中提取的时空特征的重要性成为一个挑战。提出了双层 - 空间时间特征提取和评估（DL -STFEE）模型。 DL-STFEE的下层是时空特征提取层。流量数据中的空间和时间特征是通过多画图卷积和注意机制提取的，并生成了空间和时间特征的不同组合。 DL-STFEE的上层是时空特征评估层。通过高维自我注意力发项机制产生的注意力评分矩阵，空间特征组合被融合和评估，以便获得不同组合对预测效应的影响。在实际的流量数据集上进行了三组实验，以表明DL-STFEE可以有效地捕获时空特征并评估不同时空特征组合的重要性。

translated by 谷歌翻译

A Survey on Societal Event Forecasting with Deep Learning

Songgaojun Deng , Yue Ning

分类：机器学习 | 人工智能

2021-12-12

人口级社会事件，如民事骚乱和犯罪，往往对我们的日常生活产生重大影响。预测此类事件对于决策和资源分配非常重要。由于缺乏关于事件发生的真实原因和潜在机制的知识，事件预测传统上具有挑战性。近年来，由于两个主要原因，研究事件预测研究取得了重大进展：（1）机器学习和深度学习算法的开发和（2）社交媒体，新闻来源，博客，经济等公共数据的可访问性指标和其他元数据源。软件/硬件技术中的数据的爆炸性增长导致了社会事件研究中的深度学习技巧的应用。本文致力于提供社会事件预测的深层学习技术的系统和全面概述。我们专注于两个社会事件的域名：\ Texit {Civil unrest}和\ texit {犯罪}。我们首先介绍事件预测问题如何作为机器学习预测任务制定。然后，我们总结了这些问题的数据资源，传统方法和最近的深度学习模型的发展。最后，我们讨论了社会事件预测中的挑战，并提出了一些有希望的未来研究方向。

translated by 谷歌翻译

Traffic-Twitter Transformer: A Nature Language Processing-joined Framework For Network-wide Traffic Forecasting

Meng-Ju Tsai , Zhiyong Cui , Hao , Yang , Yinhai Wang

分类：机器学习 | 人工智能

2022-06-19

通过准确，及时的流量预测，可以预先预测受影响的交通状况，以指导机构和居民适当地应对交通模式的变化。但是，例如，关于交通预测的现有作品主要依赖于仅在1小时以下的短期预测的历史流量模式。为了更好地管理未来的道路能力并适应社会和人类的影响，提出一个灵活而全面的框架以预测公共用户和运输机构的长期交通状况至关重要。在本文中，考虑到社交媒体的功能，弥合了强大的长期交通预测的差距。首先实施了相关研究和线性回归模型，以评估两个时间序列数据，流量强度和Twitter数据强度之间的相关性的重要性。然后将两个时间序列数据提供给我们提出的社会意识框架，即交通扭转变压器，该框架将大自然语言表示形式集成到时间序列记录中以进行长期流量预测。大西雅图地区的实验结果表明，我们提出的模型在所有评估矩阵中都优于基线模型。这个由NLP加入的社会感知框架可以成为交通代理机构的网络交通预测和管理的宝贵实现。

translated by 谷歌翻译

A Transferable Intersection Reconstruction Network for Traffic Speed Prediction

Pengyu Fu , Liang Chu , Zhuoran Hou , Jincheng Hu , Yanjun Huang , Yuanjian Zhang

分类：机器学习

2022-07-22

交通速度预测是许多有价值应用程序的关键，由于其各种影响因素，它也是一项具有挑战性的任务。最近的工作试图通过各种混合模型获得更多信息，从而提高了预测准确性。但是，这些方法的空间信息采集方案存在两级分化问题。建模很简单，但包含很少的空间信息，或者建模是完整的，但缺乏灵活性。为了基于确保灵活性引入更多空间信息，本文提出了IRNET（可转让的交叉点重建网络）。首先，本文将相交重建为与相同结构的虚拟交集，从而简化了道路网络的拓扑结构。然后，将空间信息细分为交叉信息和交通流向的序列信息，并通过各种模型获得时空特征。第三，一种自我发项机制用于融合时空特征以进行预测。在与基线的比较实验中，不仅预测效应，而且转移性能具有明显的优势。

translated by 谷歌翻译

A Comprehensive Review of Visual-Textual Sentiment Analysis from Social Media Networks

Israa Khalaf Salman Al-Tameemi , Mohammad-Reza Feizi-Derakhshi , Saeed Pashazadeh , Mohammad Asadpour

分类：自然语言处理 | 人工智能

2022-07-05

社交媒体网络已成为人们生活的重要方面，它是其思想，观点和情感的平台。因此，自动化情绪分析（SA）对于以其他信息来源无法识别人们的感受至关重要。对这些感觉的分析揭示了各种应用，包括品牌评估，YouTube电影评论和医疗保健应用。随着社交媒体的不断发展，人们以不同形式发布大量信息，包括文本，照片，音频和视频。因此，传统的SA算法已变得有限，因为它们不考虑其他方式的表现力。通过包括来自各种物质来源的此类特征，这些多模式数据流提供了新的机会，以优化基于文本的SA之外的预期结果。我们的研究重点是多模式SA的最前沿领域，该领域研究了社交媒体网络上发布的视觉和文本数据。许多人更有可能利用这些信息在这些平台上表达自己。为了作为这个快速增长的领域的学者资源，我们介绍了文本和视觉SA的全面概述，包括数据预处理，功能提取技术，情感基准数据集以及适合每个字段的多重分类方法的疗效。我们还简要介绍了最常用的数据融合策略，并提供了有关Visual Textual SA的现有研究的摘要。最后，我们重点介绍了最重大的挑战，并调查了一些重要的情感应用程序。

translated by 谷歌翻译

Stock Market Prediction via Deep Learning Techniques: A Survey

Jinan Zou , Qingying Zhao , Yang Jiao , Haiyao Cao , Yanxi Liu , Qingsen Yan , Ehsan Abbasnejad , Lingqiao Liu , Javen Qinfeng Shi

分类：人工智能

2022-12-24

The stock market prediction has been a traditional yet complex problem researched within diverse research areas and application domains due to its non-linear, highly volatile and complex nature. Existing surveys on stock market prediction often focus on traditional machine learning methods instead of deep learning methods. Deep learning has dominated many domains, gained much success and popularity in recent years in stock market prediction. This motivates us to provide a structured and comprehensive overview of the research on stock market prediction focusing on deep learning techniques. We present four elaborated subtasks of stock market prediction and propose a novel taxonomy to summarize the state-of-the-art models based on deep neural networks from 2011 to 2022. In addition, we also provide detailed statistics on the datasets and evaluation metrics commonly used in the stock market. Finally, we highlight some open issues and point out several future directions by sharing some new perspectives on stock market prediction.

translated by 谷歌翻译

Deep Learning for Time Series Anomaly Detection: A Survey

Zahra Zamanzadeh Darban , Geoffrey I. Webb , Shirui Pan , Charu C. Aggarwal , Mahsa Salehi

分类：机器学习 | 人工智能

2022-11-09

Time series anomaly detection has applications in a wide range of research fields and applications, including manufacturing and healthcare. The presence of anomalies can indicate novel or unexpected events, such as production faults, system defects, or heart fluttering, and is therefore of particular interest. The large size and complex patterns of time series have led researchers to develop specialised deep learning models for detecting anomalous patterns. This survey focuses on providing structured and comprehensive state-of-the-art time series anomaly detection models through the use of deep learning. It providing a taxonomy based on the factors that divide anomaly detection models into different categories. Aside from describing the basic anomaly detection technique for each category, the advantages and limitations are also discussed. Furthermore, this study includes examples of deep anomaly detection in time series across various application domains in recent years. It finally summarises open issues in research and challenges faced while adopting deep anomaly detection models.

translated by 谷歌翻译

Simpler is better: Multilevel Abstraction with Graph Convolutional Recurrent Neural Network Cells for Traffic Prediction

Naghmeh Shafiee Roudbari , Zachary Patterson , Ursula Eicker , Charalambos Poullis

分类：机器学习 | 计算机视觉

2022-09-08

近年来，图形神经网络（GNN）与复发性神经网络（RNN）的变体相结合，在时空预测任务中达到了最先进的性能。对于流量预测，GNN模型使用道路网络的图形结构来解释链接和节点之间的空间相关性。最近的解决方案要么基于复杂的图形操作或避免预定义的图。本文提出了一种新的序列结构，以使用具有稀疏体系结构的GNN-RNN细胞在多个抽象的抽象上提取时空相关性，以减少训练时间与更复杂的设计相比。通过多个编码器编码相同的输入序列，并随着编码层的增量增加，使网络能够通过多级抽象来学习一般和详细的信息。我们进一步介绍了来自加拿大蒙特利尔的街道细分市场流量数据的新基准数据集。与高速公路不同，城市路段是循环的，其特征是复杂的空间依赖性。与基线方法相比，一小时预测的实验结果和我们的MSLTD街道级段数据集对我们的模型提高了7％以上，同时将计算资源要求提高了一半以上竞争方法。

translated by 谷歌翻译

Hierarchical Graph Pooling is an Effective Citywide Traffic Condition Prediction Model

Shilin Pu , Liang Chu , Zhuoran Hou , Jincheng Hu , Yanjun Huang , Yuanjian Zhang

分类：机器学习

2022-09-08

准确的交通状况预测为车辆环境协调和交通管制任务提供了坚实的基础。由于道路网络数据在空间分布中的复杂性以及深度学习方法的多样性，有效定义流量数据并充分捕获数据中复杂的空间非线性特征变得具有挑战性。本文将两种分层图池方法应用于流量预测任务，以减少图形信息冗余。首先，本文验证了流量预测任务中层次图池方法的有效性。分层图合并方法与其他基线在预测性能上形成鲜明对比。其次，应用了两种主流分层图池方法，节点群集池和节点下降池，用于分析流量预测中的优势和弱点。最后，对于上述图神经网络，本文比较了不同图网络输入对流量预测准确性的预测效应。分析和汇总定义图网络的有效方法。

translated by 谷歌翻译

Sentiment Analysis of Fashion Related Posts in Social Media

Yifei Yuan , Wai Lam

分类：自然语言处理

2021-11-15

社交媒体在时装行业中的作用在较少年的情况下一直在盛开。在这项工作中，我们调查了社交媒体平台中时尚相关员额的情绪分析。这项任务有两个主要挑战。首先，必须共同考虑不同方式的信息以进行最终预测。在第二个地方，应考虑一些独特的时尚相关的属性。虽然大多数现有的作品侧重于传统的多模式情绪分析，但它们始终未能利用此任务中的时尚相关的属性。我们提出了一种新颖的框架，共同利用图像视觉，文本，文本以及时尚属性模态来确定情绪类别。我们的模型的一个特征是它提取了时尚属性并将它们与图像视觉信息集成了有效表示。此外，它通过相互关注机制利用时尚属性和邮政文本之间的相互关系。由于没有适合此任务的现有数据集，因此我们准备了超过12K时尚相关的社交媒体帖子的大规模情感分析数据集。进行广泛的实验以证明我们模型的有效性。

translated by 谷歌翻译

Spatial-temporal traffic modeling with a fusion graph reconstructed by tensor decomposition

Qin Li , Xuan Yang , Yong Wang , Yuankai Wu , Deqiang He

分类：机器学习

2022-12-12

Accurate spatial-temporal traffic flow forecasting is essential for helping traffic managers to take control measures and drivers to choose the optimal travel routes. Recently, graph convolutional networks (GCNs) have been widely used in traffic flow prediction owing to their powerful ability to capture spatial-temporal dependencies. The design of the spatial-temporal graph adjacency matrix is a key to the success of GCNs, and it is still an open question. This paper proposes reconstructing the binary adjacency matrix via tensor decomposition, and a traffic flow forecasting method is proposed. First, we reformulate the spatial-temporal fusion graph adjacency matrix into a three-way adjacency tensor. Then, we reconstructed the adjacency tensor via Tucker decomposition, wherein more informative and global spatial-temporal dependencies are encoded. Finally, a Spatial-temporal Synchronous Graph Convolutional module for localized spatial-temporal correlations learning and a Dilated Convolution module for global correlations learning are assembled to aggregate and learn the comprehensive spatial-temporal dependencies of the road network. Experimental results on four open-access datasets demonstrate that the proposed model outperforms state-of-the-art approaches in terms of the prediction performance and computational cost.

translated by 谷歌翻译

Deep Learning based Urban Vehicle Trajectory Analytics

Seongjin Choi

分类：机器学习

2021-11-15

“轨迹”是指由地理空间中的移动物体产生的迹线，通常由一系列按时间顺序排列的点表示，其中每个点由地理空间坐标集和时间戳组成。位置感应和无线通信技术的快速进步使我们能够收集和存储大量的轨迹数据。因此，许多研究人员使用轨迹数据来分析各种移动物体的移动性。在本文中，我们专注于“城市车辆轨迹”，这是指城市交通网络中车辆的轨迹，我们专注于“城市车辆轨迹分析”。城市车辆轨迹分析提供了前所未有的机会，可以了解城市交通网络中的车辆运动模式，包括以用户为中心的旅行经验和系统范围的时空模式。城市车辆轨迹数据的时空特征在结构上相互关联，因此，许多先前的研究人员使用了各种方法来理解这种结构。特别是，由于其强大的函数近似和特征表示能力，深度学习模型是由于许多研究人员的注意。因此，本文的目的是开发基于深度学习的城市车辆轨迹分析模型，以更好地了解城市交通网络的移动模式。特别是，本文重点介绍了两项研究主题，具有很高的必要性，重要性和适用性：下一个位置预测，以及合成轨迹生成。在这项研究中，我们向城市车辆轨迹分析提供了各种新型模型，使用深度学习。

translated by 谷歌翻译

Demand Forecasting in Bike-sharing Systems Based on A Multiple Spatiotemporal Fusion Network

Xiao Yan , Gang Kou , Feng Xiao , Dapeng Zhang , Xianghua Gan

分类：计算机视觉

2020-09-23

自行车分享系统（BSSS）在全球越来越受欢迎，并引起了广泛的研究兴趣。本文研究了BSSS中的需求预测问题。空间和时间特征对于BSSS的需求预测至关重要，但提取了时尚动态的需求是挑战性的。另一个挑战是捕捉时空动力学和外部因素之间的关系，例如天气，一周和一天时间。为了解决这些挑战，我们提出了一个名为MSTF-Net的多个时空融合网络。 MSTF-Net由多个时空块组成：3D卷积网络（3D-CNN）块，Eidetic 3D卷积长短短期存储网络（E3D-LSTM）块，以及完全连接的（FC）块。具体地，3D-CNN嵌段突出显示在每个片段中提取短期时空依赖（即，亲近，期间和趋势）; E3D-LSTM块进一步提取对所有碎片的长期时空依赖; FC块提取外部因素的非线性相关性。最后，融合E3D-LSTM和FC块的潜在表示以获得最终预测。对于两个现实世界数据集，显示MSTF-Net优于七种最先进的模型。

translated by 谷歌翻译

FV2ES: A Fully End2End Multimodal System for Fast Yet Effective Video Emotion Recognition Inference

Qinglan Wei , Xuling Huang , Yuan Zhang

分类：计算机视觉

2022-09-21

在最新的社交网络中，越来越多的人喜欢通过文字，语音和丰富的面部表情在视频中表达自己的情绪。多模式的视频情感分析技术可以根据图像中的人类表情和手势，声音和公认的自然语言自动理解用户的内部世界。但是，在现有研究中，与视觉和文本方式相比，声学方式长期以来一直处于边缘位置。也就是说，改善声学方式对整个多模式识别任务的贡献往往更加困难。此外，尽管可以通过引入常见的深度学习方法来获得更好的性能，但是这些训练模型的复杂结构始终会导致推理效率低，尤其是在暴露于高分辨率和长长视频时。此外，缺乏完全端到端的多模式视频情感识别系统阻碍了其应用。在本文中，我们为快速而有效的识别推断设计了一个完全多模式的视频对情感系统（名称为FV2E），其好处是三倍：（1）在声音中，通过有限的贡献，采用了层次结构注意方法。在声学模态上，在IEMOCAP和CMU-MOSEI数据集上胜过现有模型的性能；（2）引入视觉提取的多尺度的想法，而单一用于推理的想法会带来更高的效率，并同时保持预测准确性；（3）将预处理数据的数据进一步集成到对齐的多模式学习模型中，可以显着降低计算成本和存储空间。

translated by 谷歌翻译

HGAN: Hierarchical Graph Alignment Network for Image-Text Retrieval

Jie Guo , Meiting Wang , Yan Zhou , Bin Song , Yuhao Chi , Wei Fan , Jianglong Chang

分类：计算机视觉

2022-12-16

Image-text retrieval (ITR) is a challenging task in the field of multimodal information processing due to the semantic gap between different modalities. In recent years, researchers have made great progress in exploring the accurate alignment between image and text. However, existing works mainly focus on the fine-grained alignment between image regions and sentence fragments, which ignores the guiding significance of context background information. Actually, integrating the local fine-grained information and global context background information can provide more semantic clues for retrieval. In this paper, we propose a novel Hierarchical Graph Alignment Network (HGAN) for image-text retrieval. First, to capture the comprehensive multimodal features, we construct the feature graphs for the image and text modality respectively. Then, a multi-granularity shared space is established with a designed Multi-granularity Feature Aggregation and Rearrangement (MFAR) module, which enhances the semantic corresponding relations between the local and global information, and obtains more accurate feature representations for the image and text modalities. Finally, the ultimate image and text features are further refined through three-level similarity functions to achieve the hierarchical alignment. To justify the proposed model, we perform extensive experiments on MS-COCO and Flickr30K datasets. Experimental results show that the proposed HGAN outperforms the state-of-the-art methods on both datasets, which demonstrates the effectiveness and superiority of our model.

translated by 谷歌翻译

Spatial-Temporal Meta-path Guided Explainable Crime Prediction

Yuting Sun , Tong Chen , Hongzhi Yin

分类：机器学习

2022-05-04

接触犯罪和暴力会损害个人的生活质量和社区的经济增长。鉴于机器学习的迅速发展，需要探索自动解决方案以防止犯罪。随着细粒度的城市和公共服务数据的可用性越来越多，最近融合了这种跨域信息以促进犯罪预测的激增。通过捕获有关社会结构，环境和犯罪趋势的信息，现有的机器学习预测模型从不同观点探索了动态犯罪模式。但是，这些方法主要将这种多源知识转换为隐性和潜在表示（例如，学区的嵌入），这仍然是研究显式因素对幕后犯罪发生的影响的影响仍然是一个挑战。在本文中，我们提出了一个时空的元数据指导性犯罪预测（STMEC）框架，以捕获犯罪行为的动态模式，并明确地表征了环境和社会因素如何相互互动以产生预测。广泛的实验表明，与其他先进的时空模型相比，STMEC的优越性，尤其是在预测重罪（例如使用危险武器的抢劫和袭击）时。

translated by 谷歌翻译

Traffic Accident Risk Forecasting using Contextual Vision Transformers

Khaled Saleh , Artur Grigorev , Adriana-Simona Mihaita

分类：计算机视觉 | 人工智能

2022-09-20

最近，由于其对交通清算的重大影响，交通事故风险预测的问题一直引起了智能运输系统社区的关注。通过使用数据驱动的方法来对空间和时间事件的影响进行建模，因此在文献中通常可以解决此问题，因为它们被证明对于交通事故风险预测问题至关重要。为了实现这一目标，大多数方法构建了不同的体系结构以捕获时空相关性功能，从而使它们对大型交通事故数据集效率低下。因此，在这项工作中，我们提出了一个新颖的统一框架，即是上下文视觉变压器，可以通过端到端的方法进行培训，该方法可以有效地建议问题的空间和时间方面，同时提供准确的交通事故。风险预测。我们评估并比较了我们提出的方法的性能与来自两个不同地理位置的两个大规模交通事故数据集的文献的基线方法。结果表明，与文献中先前的最新作品（SOTA）相比，RMSE得分的重大改善大约为2 \％。此外，我们提出的方法在两个数据集上优于SOTA技术，而仅需要少23倍的计算要求。

translated by 谷歌翻译

A Survey of Natural Language Generation

Chenhe Dong , Yinghui Li , Haifan Gong , Miaoxin Chen , Junxin Li , Ying Shen , Min Yang

分类：自然语言处理 | 人工智能 | 机器学习

2021-12-22

本文对过去二十年来对自然语言生成（NLG）的研究提供了全面的审查，特别是与数据到文本生成和文本到文本生成深度学习方法有关，以及NLG的新应用技术。该调查旨在（a）给出关于NLG核心任务的最新综合，以及该领域采用的建筑;（b）详细介绍各种NLG任务和数据集，并提请注意NLG评估中的挑战，专注于不同的评估方法及其关系;（c）强调一些未来的强调和相对近期的研究问题，因为NLG和其他人工智能领域的协同作用而增加，例如计算机视觉，文本和计算创造力。

translated by 谷歌翻译

Aerial Images Meet Crowdsourced Trajectories: A New Approach to Robust Road Extraction

Lingbo Liu , Zewei Yang , Guanbin Li , Kuo Wang , Tianshui Chen , Liang Lin

分类：计算机视觉 | 人工智能

2021-11-30

土地遥感分析是地球科学的一个至关重要的研究。在这项工作中，我们专注于土地分析的挑战任务，即自动提取来自遥感数据的交通道路，在城市发展和扩展估计中具有广泛的应用。然而，传统方法仅利用空中图像的有限信息，或者简单地融合多峰信息（例如，车辆轨迹），因此无法识别不受约束的道路。为了促进这个问题，我们介绍了一种新的神经网络框架，称为跨模型消息传播网络（CMMPNET），其完全有益于互补的不同模态数据（即，空中图像和众包轨迹）。具体地，CMMPNET由两个深度自动编码器组成，用于模态特定的表示学习和用于跨模型表示细化的定制设计的双增强模块。特别地，全面提取和动态地传播每个模态的互补信息以增强另一个模态的表示。关于三个真实基准的广泛实验展示了我们CMMPNET对强大的道路提取的有效性，这些资务道路提取受益于使用图像和轨迹数据或图像和LIDAR数据进行混合不同的模态数据。从实验结果来看，我们观察到所提出的方法优于大型利润率的当前最先进的方法。

translated by 谷歌翻译