智能论文笔记

Spatial Distribution Patterns of Clownfish in Recirculating Aquaculture Systems

Fahad Aljehani , Ibrahima N'Doye , Micaela S. Justo , John E. Majoris , Michael L. Berumen , Taous-Meriem Laleg-Kirati

分类：计算机视觉

2021-12-29

监测和检测鱼类行为提供有关鱼类福利的基本信息，并有助于实现全球水产养殖中的智能制作。这项工作提出了一种有效的方法，分析了三个袜子密度（1,5和10个个人/水族馆）在水族馆维护的少年小丑鱼（Amphiprion Bicinctus）的空间分布状态和运动模式。估计的位移是评估分散和速度的关键因素，以表达在再循环水产养殖系统中表达小丑鱼的空间分布和运动行为的关键因素。实际上，我们的目标是使用光学流动方法计算速度，幅度和转动角度，以帮助水平养殖者有效地监测和识别鱼类行为。我们在包含在水族馆维护的少年小丑鱼视频流的数据库上测试系统设计。所提出的位移估计揭示了测量小丑鱼运动和色散特征的良好性能。此外，我们展示了提出的技术来定量在早上和下午拍摄的录音之间的小丑鱼活动水平变化的有效性。

translated by 谷歌翻译

Review on Social Behavior Analysis of Laboratory Animals: From Methodologies to Applications

Ziping Jiang , Paul L. Chazot , Richard Jiang

分类：计算机视觉 | 机器学习

2022-06-25

作为遗传和生理方面之间的桥梁，动物行为分析是生物学和生态学研究中最重要的主题之一。但是，识别，跟踪和记录动物行为是需要专业知识的劳动密集型作品。为了减轻注释数据的支出，研究人员转向用于自动标签算法的计算机视觉技术，因为大多数数据都是视觉记录的。在这项工作中，我们探讨了各种行为检测算法，涵盖了传统的视觉方法，统计方法和深度学习方法。这项工作的目的是对相关工作进行彻底的研究，为生物学家提供有效的动物行为检测方法。除此之外，我们还讨论了这些算法的优势和缺点，以为已经深入研究该领域的人们提供一些见解。

translated by 谷歌翻译

Camera Measurement of Physiological Vital Signs

Daniel McDuff

分类：计算机视觉 | 机器学习

2021-11-22

对医疗保健监控的远程工具的需求从未如此明显。摄像机测量生命体征利用成像装置通过分析人体的图像来计算生理变化。建立光学，机器学习，计算机视觉和医学的进步这些技术以来的数码相机的发明以来已经显着进展。本文介绍了对生理生命体征的相机测量综合调查，描述了它们可以测量的重要标志和实现所做的计算技术。我涵盖了临床和非临床应用以及这些应用需要克服的挑战，以便从概念上推进。最后，我描述了对研究社区可用的当前资源（数据集和代码），并提供了一个全面的网页（https://cameravitals.github.io/），其中包含这些资源的链接以及其中引用的所有文件的分类列表文章。

translated by 谷歌翻译

Computer vision system to count crustacean larvae

Chen Rothschild

分类：计算机视觉

2022-09-13

截至2017年，鱼类产品约占全球人类饮食的16％。计数作用是生产和生产这些产品的重要组成部分。种植者必须准确计算鱼类，以便这样做技术解决方案。开发了两个计算机视觉系统，以自动计算在工业池塘中生长的甲壳类幼虫。第一个系统包括带有3024x4032分辨率的iPhone 11摄像头，该摄像头在室内条件下从工业池塘中获取图像。使用该系统进行了两次实验，第一部实验包括在一天的增长阶段，在9,10的一天中使用iPhone 11相机在特定照明条件下获得的200张图像。在第二个实验中，用两个设备iPhone 11和索尼DSCHX90V摄像机拍摄了一个幼虫工业池。使用第一个设备（iPhone 11）测试了两个照明条件。在每种情况下，都获得了110张图像。该系统的准确性为88.4％的图像检测。第二个系统包括DSLR Nikon D510相机，具有2000x2000分辨率，在工业池塘外进行了七次实验。在幼虫生长阶段的第1天获取图像，从而获得了总共700张图像。该系统的密度为50的精度为86％。一种基于Yolov5 CNN模型开发的算法，该算法自动计算两种情况的幼虫数量。此外，在这项研究中，开发了幼虫生长函数。每天，从工业池塘手动取几个幼虫，并在显微镜下进行分析。确定生长阶段后，就获得了幼虫的图像。每个幼虫的长度都是通过图像手动测量的。最合适的模型是Gompertz模型，其拟合指数的良好性r平方为0.983。

translated by 谷歌翻译

Roadmap on Signal Processing for Next Generation Measurement Systems

D. K. Iakovidis , M. Ooi , Y. C. Kuang , S. Damidenko , A. Shestakov , V. Sinistin , M. Henry , A. Sciacchitano , A. Discetti , S. Donati

分类：人工智能 | 计算机视觉

2021-11-03

信号处理是几乎任何传感器系统的基本组件，具有不同科学学科的广泛应用。时间序列数据，图像和视频序列包括可以增强和分析信息提取和量化的代表性形式的信号。人工智能和机器学习的最近进步正在转向智能，数据驱动，信号处理的研究。该路线图呈现了最先进的方法和应用程序的关键概述，旨在突出未来的挑战和对下一代测量系统的研究机会。它涵盖了广泛的主题，从基础到工业研究，以简明的主题部分组织，反映了每个研究领域的当前和未来发展的趋势和影响。此外，它为研究人员和资助机构提供了识别新前景的指导。

translated by 谷歌翻译

Going Deeper than Tracking: a Survey of Computer-Vision Based Recognition of Animal Pain and Affective States

Sofia Broomé , Marcelo Feighelstein , Anna Zamansky , Gabriel Carreira Lencioni , Pia Haubro Andersen , Francisca Pessanha , Marwa Mahmoud , Hedvig Kjellström , Albert Ali Salah

分类：计算机视觉

2022-06-16

动物运动跟踪和姿势识别的进步一直是动物行为研究的游戏规则改变者。最近，越来越多的作品比跟踪“更深”，并解决了对动物内部状态（例如情绪和痛苦）的自动认识，目的是改善动物福利，这使得这是对该领域进行系统化的及时时刻。本文对基于计算机的识别情感状态和动物的疼痛的研究进行了全面调查，并涉及面部行为和身体行为分析。我们总结了迄今为止在这个主题中所付出的努力 - 对它们进行分类，从不同的维度进行分类，突出挑战和研究差距，并提供最佳实践建议，以推进该领域以及一些未来的研究方向。

translated by 谷歌翻译

An Overview of Violence Detection Techniques: Current Challenges and Future Directions

Nadia Mumtaz , Naveed Ejaz , Shabana Habib , Syed Muhammad Mohsin , Prayag Tiwari , Shahab S. Band , Neeraj Kumar

分类：计算机视觉 | 人工智能

2022-09-21

当今智能城市中产生的大型视频数据从其有目的的用法角度引起了人们的关注，其中监视摄像机等是最突出的资源，是为大量数据做出贡献的最突出的资源，使其自动化分析成为计算方面的艰巨任务。和精确。暴力检测（VD）在行动和活动识别域中广泛崩溃，用于分析大型视频数据，以了解由于人类而引起的异常动作。传统上，VD文献基于手动设计的功能，尽管开发了基于深度学习的独立模型的进步用于实时VD分析。本文重点介绍了深度序列学习方法以及检测到的暴力的本地化策略。该概述还介入了基于机器学习的初始图像处理和基于机器学习的文献及其可能具有的优势，例如针对当前复杂模型的效率。此外，讨论了数据集，以提供当前模型的分析，并用对先前方法的深入分析得出的VD域中的未来方向解释了他们的利弊。

translated by 谷歌翻译

Spatial Monitoring and Insect Behavioural Analysis Using Computer Vision for Precision Pollination

Malika Nisal Ratnayake , Don Chathurika Amarathunga , Asaduz Zaman , Adrian G. Dyer , Alan Dorin

分类：计算机视觉

2022-05-10

Insects are the most important global pollinator of crops and play a key role in maintaining the sustainability of natural ecosystems. Insect pollination monitoring and management are therefore essential for improving crop production and food security. Computer vision facilitated pollinator monitoring can intensify data collection over what is feasible using manual approaches. The new data it generates may provide a detailed understanding of insect distributions and facilitate fine-grained analysis sufficient to predict their pollination efficacy and underpin precision pollination. Current computer vision facilitated insect tracking in complex outdoor environments is restricted in spatial coverage and often constrained to a single insect species. This limits its relevance to agriculture. Therefore, in this article we introduce a novel system to facilitate markerless data capture for insect counting, insect motion tracking, behaviour analysis and pollination prediction across large agricultural areas. Our system is comprised of edge computing multi-point video recording, offline automated multispecies insect counting, tracking and behavioural analysis. We implement and test our system on a commercial berry farm to demonstrate its capabilities. Our system successfully tracked four insect varieties, at nine monitoring stations within polytunnels, obtaining an F-score above 0.8 for each variety. The system enabled calculation of key metrics to assess the relative pollination impact of each insect variety. With this technological advancement, detailed, ongoing data collection for precision pollination becomes achievable. This is important to inform growers and apiarists managing crop pollination, as it allows data-driven decisions to be made to improve food production and food security.

translated by 谷歌翻译

Deep Learning and Earth Observation to Support the Sustainable Development Goals

Claudio Persello , Jan Dirk Wegner , Ronny Hänsch , Devis Tuia , Pedram Ghamisi , Mila Koeva , Gustau Camps-Valls

分类：机器学习

2021-12-21

深度学习模式和地球观察的协同组合承诺支持可持续发展目标（SDGS）。新的发展和夸张的申请已经在改变人类将面临生活星球挑战的方式。本文审查了当前对地球观测数据的最深入学习方法，以及其在地球观测中深度学习的快速发展受到影响和实现最严重的SDG的应用。我们系统地审查案例研究至1）实现零饥饿，2）可持续城市，3）提供保管安全，4）减轻和适应气候变化，5）保留生物多样性。关注重要的社会，经济和环境影响。提前令人兴奋的时期即将到来，算法和地球数据可以帮助我们努力解决气候危机并支持更可持续发展的地方。

translated by 谷歌翻译

Event and Activity Recognition in Video Surveillance for Cyber-Physical Systems

Swarnabja Bhaumik , Prithwish Jana , Partha Pratim Mohanta

分类：计算机视觉 | 机器学习 | 机器人

2021-11-03

本章旨在帮助开发网络 - 物理系统（CPS）在视频监控的各种应用中自动理解事件和活动。这些事件主要由无人机，中央电视台或新手和低端设备上的非熟板捕获。由于许多质量因素，这些视频是不受约束的，这些视频是非常挑战性的。我们在多年来提出了为解决问题的各种方法提供了广泛的陈述。这根据来自基于运动（SFM）的结构的方法，涉及涉及深神经网络的最近解决方案框架的方法。我们表明，长期运动模式在识别事件的任务中，单独发挥枢轴作用。因此，每个视频由使用基于图形的方法的固定数量的键帧显着表示。仅使用混合卷积神经网络（CNN）+经常性神经网络（RNN）架构利用时间特征。我们获得的结果是令人鼓舞的，因为它们优于标准的时间CNN，并且与使用空间信息以及运动提示的人员相提并论。进一步探索多际型号，我们构思了网络的空间和时间翼的多层融合策略。使用偏置的混合技术获得对视频和帧级别的各个预测载体的整合表示。与最先进的方法相比，融合策略在每个阶段的精度赋予我们更高的精度，因此在分类中实现了强大的共识。结果记录在动作识别域，即CCV，HMDB，UCF-101和KCV中广泛使用的四个基准数据集。可推动的是，专注于视频序列的更好分类肯定会导致强大的致动设计用于事件监视和对象暨活动跟踪的系统。

translated by 谷歌翻译

Integrating Deep Learning and Augmented Reality to Enhance Situational Awareness in Firefighting Environments

Manish Bhattarai

分类：计算机视觉

2021-07-23

我们提出了一种新的四管齐下的方法，在文献中首次建立消防员的情境意识。我们构建了一系列深度学习框架，彼此之叠，以提高消防员在紧急首次响应设置中进行的救援任务的安全性，效率和成功完成。首先，我们使用深度卷积神经网络（CNN）系统，以实时地分类和识别来自热图像的感兴趣对象。接下来，我们将此CNN框架扩展了对象检测，跟踪，分割与掩码RCNN框架，以及具有多模级自然语言处理（NLP）框架的场景描述。第三，我们建立了一个深入的Q学习的代理，免受压力引起的迷失方向和焦虑，能够根据现场消防环境中观察和存储的事实来制定明确的导航决策。最后，我们使用了一种低计算无监督的学习技术，称为张量分解，在实时对异常检测进行有意义的特征提取。通过这些临时深度学习结构，我们建立了人工智能系统的骨干，用于消防员的情境意识。要将设计的系统带入消防员的使用，我们设计了一种物理结构，其中处理后的结果被用作创建增强现实的投入，这是一个能够建议他们所在地的消防员和周围的关键特征，这对救援操作至关重要在手头，以及路径规划功能，充当虚拟指南，以帮助迷彩的第一个响应者恢复安全。当组合时，这四种方法呈现了一种新颖的信息理解，转移和综合方法，这可能会大大提高消防员响应和功效，并降低寿命损失。

translated by 谷歌翻译

Analysis of the hands in egocentric vision: A survey

Andrea Bandini , José Zariffa

分类：计算机视觉

2019-12-23

由于价格合理的可穿戴摄像头和大型注释数据集的可用性，在过去几年中，Egintric Vision（又名第一人称视觉-FPV）的应用程序在过去几年中蓬勃发展。可穿戴摄像机的位置（通常安装在头部上）允许准确记录摄像头佩戴者在其前面的摄像头，尤其是手和操纵物体。这种内在的优势可以从多个角度研究手：将手及其部分定位在图像中；了解双手涉及哪些行动和活动；并开发依靠手势的人类计算机界面。在这项调查中，我们回顾了使用以自我为中心的愿景专注于手的文献，将现有方法分类为：本地化（其中的手或部分在哪里？）；解释（手在做什么？）；和应用程序（例如，使用以上为中心的手提示解决特定问题的系统）。此外，还提供了带有手基注释的最突出的数据集的列表。

translated by 谷歌翻译

Applications of Machine Learning in Chemical and Biological Oceanography

Balamurugan Sadaiappan , Preethiya Balakrishnan , Vishal CR , Neethu T Vijayan , Mahendran Subramanian , Mangesh U Gauns

分类：机器学习

2022-09-23

机器学习（ML）是指根据大量数据预测有意义的输出或对复杂系统进行分类的计算机算法。 ML应用于各个领域，包括自然科学，工程，太空探索甚至游戏开发。本文的重点是在化学和生物海洋学领域使用机器学习。在预测全球固定氮水平，部分二氧化碳压力和其他化学特性时，ML的应用是一种有前途的工具。机器学习还用于生物海洋学领域，可从各种图像（即显微镜，流车和视频记录器），光谱仪和其他信号处理技术中检测浮游形式。此外，ML使用其声学成功地对哺乳动物进行了分类，在特定的环境中检测到濒临灭绝的哺乳动物和鱼类。最重要的是，使用环境数据，ML被证明是预测缺氧条件和有害藻华事件的有效方法，这是对环境监测的重要测量。此外，机器学习被用来为各种物种构建许多对其他研究人员有用的数据库，而创建新算法将帮助海洋研究界更好地理解海洋的化学和生物学。

translated by 谷歌翻译

Face-to-Face Co-Located Human-Human Social Interaction Analysis using Nonverbal Cues: A Survey

Cigdem Beyan , Alessandro Vinciarelli , Alessio Del Bue

分类：人工智能 | 计算机视觉 | 机器学习

2022-07-20

这项工作对最近的努力进行了系统的综述（自2010年以来），旨在自动分析面对面共同关联的人类社交互动中显示的非语言提示。专注于非语言提示的主要原因是，这些是社会和心理现象的物理，可检测到的痕迹。因此，检测和理解非语言提示至少在一定程度上意味着检测和理解社会和心理现象。所涵盖的主题分为三个：a）建模社会特征，例如领导力，主导，人格特质，b）社会角色认可和社会关系检测以及c）群体凝聚力，同情，rapport和so的互动动态分析向前。我们针对共同的相互作用，其中相互作用的人永远是人类。该调查涵盖了各种各样的环境和场景，包括独立的互动，会议，室内和室外社交交流，二元对话以及人群动态。对于他们每个人，调查都考虑了非语言提示分析的三个主要要素，即数据，传感方法和计算方法。目的是突出显示过去十年的主要进步，指出现有的限制并概述未来的方向。

translated by 谷歌翻译

Multi-view Tracking, Re-ID, and Social Network Analysis of a Flock of Visually Similar Birds in an Outdoor Aviary

Shiting Xiao , Yufu Wang , Ammon Perkes , Bernd Pfrommer , Marc Schmidt , Kostas Daniilidis , Marc Badger

分类：计算机视觉

2022-12-01

The ability to capture detailed interactions among individuals in a social group is foundational to our study of animal behavior and neuroscience. Recent advances in deep learning and computer vision are driving rapid progress in methods that can record the actions and interactions of multiple individuals simultaneously. Many social species, such as birds, however, live deeply embedded in a three-dimensional world. This world introduces additional perceptual challenges such as occlusions, orientation-dependent appearance, large variation in apparent size, and poor sensor coverage for 3D reconstruction, that are not encountered by applications studying animals that move and interact only on 2D planes. Here we introduce a system for studying the behavioral dynamics of a group of songbirds as they move throughout a 3D aviary. We study the complexities that arise when tracking a group of closely interacting animals in three dimensions and introduce a novel dataset for evaluating multi-view trackers. Finally, we analyze captured ethogram data and demonstrate that social context affects the distribution of sequential interactions between birds in the aviary.

translated by 谷歌翻译

Gait Recognition Based on Deep Learning: A Survey

Claudio Filipi Gonçalves dos Santos , Diego de Souza Oliveira , Leandro A. Passos , Rafael Gonçalves Pires , Daniel Felipe Silva Santos , Lucas Pascotti Valem , Thierry P. Moreira , Marcos Cleison S. Santana , Mateus Roder , João Paulo Papa

分类：计算机视觉 | 机器学习

2022-01-10

通常，基于生物谱系的控制系统可能不依赖于各个预期行为或合作适当运行。相反，这种系统应该了解未经授权的访问尝试的恶意程序。文献中提供的一些作品建议通过步态识别方法来解决问题。这些方法旨在通过内在的可察觉功能来识别人类，尽管穿着衣服或配件。虽然该问题表示相对长时间的挑战，但是为处理问题的大多数技术存在与特征提取和低分类率相关的几个缺点，以及其他问题。然而，最近的深度学习方法是一种强大的一组工具，可以处理几乎任何图像和计算机视觉相关问题，为步态识别提供最重要的结果。因此，这项工作提供了通过步态认可的关于生物识别检测的最近作品的调查汇编，重点是深入学习方法，强调他们的益处，暴露出弱点。此外，它还呈现用于解决相关约束的数据集，方法和体系结构的分类和表征描述。

translated by 谷歌翻译

Toyota Smarthome Untrimmed: Real-World Untrimmed Videos for Activity Detection

Rui Dai , Srijan Das , Saurav Sharma , Luca Minciullo , Lorenzo Garattoni , Francois Bremond , Gianpiero Francesca

分类：计算机视觉

2020-10-28

设计可以成功部署在日常生活环境中的活动检测系统需要构成现实情况典型挑战的数据集。在本文中，我们介绍了一个新的未修剪日常生存数据集，该数据集具有几个现实世界中的挑战：Toyota Smarthome Untrimmed（TSU）。 TSU包含以自发方式进行的各种活动。数据集包含密集的注释，包括基本的，复合活动和涉及与对象相互作用的活动。我们提供了对数据集所需的现实世界挑战的分析，突出了检测算法的开放问题。我们表明，当前的最新方法无法在TSU数据集上实现令人满意的性能。因此，我们提出了一种新的基线方法，以应对数据集提供的新挑战。此方法利用一种模态（即视线流）生成注意力权重，以指导另一种模态（即RGB）以更好地检测活动边界。这对于检测以高时间差异为特征的活动特别有益。我们表明，我们建议在TSU和另一个受欢迎的挑战数据集Charades上优于最先进方法的方法。

translated by 谷歌翻译

Open-Source Tools for Behavioral Video Analysis: Setup, Methods, and Development

Kevin Luxem , Jennifer J. Sun , Sean P. Bradley , Keerthi Krishnan , Eric A. Yttri , Jan Zimmermann , Talmo D. Pereira , Mark Laubach

分类：计算机视觉

2022-04-06

Recently developed methods for video analysis, especially models for pose estimation and behavior classification, are transforming behavioral quantification to be more precise, scalable, and reproducible in fields such as neuroscience and ethology. These tools overcome long-standing limitations of manual scoring of video frames and traditional "center of mass" tracking algorithms to enable video analysis at scale. The expansion of open-source tools for video acquisition and analysis has led to new experimental approaches to understand behavior. Here, we review currently available open-source tools for video analysis and discuss how to set up these methods for labs new to video recording. We also discuss best practices for developing and using video analysis methods, including community-wide standards and critical needs for the open sharing of datasets and code, more widespread comparisons of video analysis methods, and better documentation for these methods especially for new users. We encourage broader adoption and continued development of these tools, which have tremendous potential for accelerating scientific progress in understanding the brain and behavior.

translated by 谷歌翻译

A Multi-Modal Wildfire Prediction and Personalized Early-Warning System Based on a Novel Machine Learning Framework

Rohan Tan Bhowmik

分类：机器学习 | 人工智能 | 计算机视觉

2022-08-18

野火越来越多地影响环境，人类健康和安全。在加利福尼亚前20名野火中，2020 - 2021年的野火比上世纪的燃烧更大。加利福尼亚的2018年野火季节造成了1485亿美元的损失。在数百万受影响的人中，由于不足的警报手段，残疾人（约占世界人口的15％）受到不成比例的影响。在该项目中，基于先进的机器学习体系结构开发了多模式野火预测和个性化预警系统。从2012年到2018年的环境保护局和历史野火数据的传感器数据已编译，以建立一个全面的野火数据库，即同类最大的数据库。接下来，设计了一种新型的U-Convolutional-LSTM（长短期记忆）神经网络，设计了一种特殊的体系结构，可从连续的环境参数中提取关键的空间和时间特征，以指示即将来临的野火。环境和气象因素被纳入数据库，并分类为主要指标和落后指标，分别与野火构想和传播的风险相关。此外，地质数据还用于提供更好的野火风险评估。这种新颖的时空神经网络使用传统的卷积神经网络实现了> 97％的精度，而左右的卷积神经网络则达到了约76％，成功地预测了2018年2018年最具破坏性的野火，提前5-14天提前5-14天。最后，提出了一种个性化的预警系统，该警告系统针对有感觉障碍或呼吸系统加剧条件的人量身定制。该技术将使消防部门在袭击之前预测和防止野火，并为处于危险中的个人提供早期警告以更好地准备，从而挽救生命并减少经济损失。

translated by 谷歌翻译

Deep Learning to See: Towards New Foundations of Computer Vision

Alessandro Betti , Marco Gori , Stefano Melacci

分类：计算机视觉

2022-06-30

在过去的几年中，计算机视觉的显着进步总的来说是归因于深度学习，这是由于大量标记数据的可用性所推动的，并与GPU范式的爆炸性增长配对。在订阅这一观点的同时，本书批评了该领域中所谓的科学进步，并在基于信息的自然法则的框架内提出了对愿景的调查。具体而言，目前的作品提出了有关视觉的基本问题，这些问题尚未被理解，引导读者走上了一个由新颖挑战引起的与机器学习基础共鸣的旅程。中心论点是，要深入了解视觉计算过程，有必要超越通用机器学习算法的应用，而要专注于考虑到视觉信号的时空性质的适当学习理论。

translated by 谷歌翻译