Optimization problems with more than one objective consist in a very attractive topic for researchers due to its applicability in real-world situations. Over the years, the research effort in the Computational Intelligence field resulted in algorithms able to achieve good results by solving problems with more than one conflicting objective. However, these techniques do not exhibit the same performance as the number of objectives increases and become greater than 3. This paper proposes an adaptation of the metaheuristic Fish School Search to solve optimization problems with many objectives. This adaptation is based on the division of the candidate solutions in clusters that are specialized in solving a single-objective problem generated by the decomposition of the original problem. For this, we used concepts and ideas often employed by state-of-the-art algorithms, namely: (i) reference points and lines in the objectives space; (ii) clustering process; and (iii) the decomposition technique Penalty-based Boundary Intersection. The proposed algorithm was compared with two state-of-the-art bio-inspired algorithms. Moreover, a version of the proposed technique tailored to solve multi-modal problems was also presented. The experiments executed have shown that the performance obtained by both versions is competitive with state-of-the-art results.
translated by 谷歌翻译
文本阅读过程中的眼动可以提供有关阅读障碍的见解。通过眼动仪,我们可以测量眼睛移动的时间,地点和方式与他们阅读的单词的关系。机器学习(ML)算法可以解码该信息并提供差异分析。这项工作开发了DysLexML,一种用于发育性阅读障碍的筛查工具,其应用各种ML算法来分析在儿童的静音阅读期间通过眼睛跟踪记录的固定点。它使用在69个本地Greekspeakers儿童中进行的系统性实地研究中收集的测量结果对其性能进行了相对评估,其中32个被官方政府机构诊断为阅读困难,用于诊断希腊的学习和阅读困难。我们根据统计特性检查了大量特征进化和扫视运动,并确定具有突出预测能力的那些,进行降维。具体来说,DysLexML使用线性SVM实现其最佳性能,精度为97%,具有小的特征集,即扫视长度,短前向移动的数量和多个固定单词的数量。此外,我们分析了噪声对固定位置的影响,并表明DysLexML在存在噪声的情况下是准确和稳健的。这些令人鼓舞的结果为在不太受控制的大规模环境中开发筛查工具奠定了基础,使用廉价的眼动仪,可能会在更早的人口中进行干预。
translated by 谷歌翻译
从社会互动的角度考虑群体的效率,在多个项目中分配人员是一个重要的问题。在本文中,基于以前的工作,基于社会计量技术的多队形成问题(MTFP)被制定为一个优化问题,考虑到团队成员之间的社会互动。为了解决由此产生的优化问题,我们提出了一种遗传算法,因为该问题具有NP难度性质。社会凝聚力是一个直接影响工作环境生产力的重要问题。因此,保持适当的凝聚力水平可以使一个团队聚集在一起,这将对项目的结果产生积极影响。该提案的目的是从社会互动的角度确保最佳的有效性。通过这种方式,所提出的算法可以作为管理者在多个项目中构建人员的决策工具。为了分析所提方法的性能,进行了基准测试的计算实验,并与穷举法进行了比较。结果是有希望的,并表明该算法通常在短的计算时间内获得接近最优的结果。
translated by 谷歌翻译
人们越来越关注胸部X射线(CXR)的自动分析,作为筛查肺结核易感人群的敏感且廉价的手段。在这项工作中,我们评估了最新版本的CAD4TB,这是一个专为此目的而设计的软件平台。 CAD4TB的第6版于2018年发布,并在此处在5565个CXR图像的独立数据集上进行测试,其中可获得GeneXpert(Xpert)痰测试结果(854名Xpert阳性受试者)。对500名受试者(50%Xpert阳性)的子集进行了审查和注释。 5名专家观察员独立获得放射参考标准。相对于Xpert和放射参考标准,CAD4TB的最新版本在接收器操作曲线(ROC)下的面积方面优于所有先前版本。对于Xpert的改进在高灵敏度水平下是明显的,在90%灵敏度下获得76%的特异性。与放射学参考标准相比,CAD4TB v6在相当大的范围内优于以前的版本,在90%灵敏度下达到98%的特异性。 CAD4TB v6的性能与任何针对Xpert参考标准的专家观察者之间没有发现实质性差异。对该数据集的成本和效率分析表明,在标准临床情况下,以90%的灵敏度运行,CAD4TB v6的用户每天可处理132个受试者,每个屏幕的平均成本为每个主题5.95美元,而版本3的用户仅处理85个主题每天每人只需支付8.41美元。在所有测试的操作点上,版本6显示出比任何其他版本更高效且更具成本效益。
translated by 谷歌翻译
分析电视剧和电影背后的故事往往需要了解角色是什么以及他们在做什么。随着深层面部模型的改进,这似乎是一个已解决的问题。然而,随着面部检测器越来越好,需要重新考虑聚类/识别以解决面部外观中增加的多样性。在本文中,我们使用无监督方法解决视频人脸聚类问题。我们的重点是从使用深度预训练面网络获得的表示中提取基本信息,身份。我们提出了一种自我监督的Siamese网络,可以在不需要基于视频/轨道的监督的情况下进行训练,因此也可以应用于图像集。我们在三个视频聚类数据集上评估我们提出的方法。实验表明,我们的方法在所有数据集上都优于当前最先进的方法。视频人脸聚类是一个共同的基准,因为当前的作品通常用不同的度量和/或不同的人脸轨迹集来评估。
translated by 谷歌翻译
传统的治疗方法限制了外科医生的灵活性控制,这是由于有限的视野。随着机器人辅助手术的出现,微创手术的医疗技术已经发生了范式转变。然而,在手术场景中追踪手术器械的位置是非常具有挑战性的,并且精确检测和识别手术工具是至关重要的。基于深度学习的手术视频的语义分割框架有可能促进这项任务。在这项工作中,我们通过引入经过预先训练的编码器并重新设计解码器部分来修改名为U-NetPlus的U-Net架构,方法是将转置的卷积操作替换为基于最近邻(NN)插值的上采样操作。为了进一步提高性能,我们还采用了一种非常快速且灵活的数据增强技术。我们通过MICCAI 2017EndoVis Challenge数据集对8 x 225帧机器人手术视频序列进行了框架训练,并在8 x 75帧和2 x 300帧视频上进行了测试。使用我们的U-NetPlus架构,我们报告用于二进制分割的90.20%DICE,用于仪器部分分割的76.26%DICE,以及​​用于仪器类型(即,所有仪器)分段的46.07%,优于在这些数据上实现和测试的先前技术的结果。
translated by 谷歌翻译
我们研究了具有对抗性扰动的线性动力系统的控制(与统计噪声相反)。我们考虑的目标是遗憾:我们希望在线控制程序几乎可以完成与完全了解后方干扰相关的程序。我们的主要结果是一个有效的算法,为这个问题提供了近乎严格的限制。从技术角度来看,这项工作在以前的工作中主要集中在两个主要方面:我们的模型允许动力学中的有源噪声,并允许一般的凸成本。
translated by 谷歌翻译
康复训练是改善中风后运动恢复的主要干预措施,但目前尚不存在衡量功能训练的工具。为了弥合这一差距,我们之前开发了一种使用可穿戴传感器和机器学习(ML)算法对功能运动基元进行分类的方法。我们发现这种方法具有令人鼓舞的分类性能,但具有计算和实际限制,例如训练时间,传感器成本和磁漂移。在这里,我们试图改进这种方法,以确定最大化计算和实际性能所需的算法,传感器配置和数据要求。先前已经从穿着11个惯性测量单元(IMU)的6名中风患者收集运动数据,因为他们在目标阵列上移动物体。为了识别最佳ML性能,我们评估了4种常用于活动识别(线性判别分析(LDA),na iveBayes,支持向量机和k近邻)的算法。我们比较了它们的分类准确性,计算复杂性和调整要求为了识别最佳传感器配置,我们逐步采样较少的传感器并比较分类精度。为了确定最佳数据要求,我们使用IMU与加速度计的数据比较精确度。我们发现LDA具有最高的分类精度(92%)的测试算法。最实用的,低训练和测试时间以及适度的调整要求。我们发现在手臂和背部的7个传感器产生了最佳的精度。使用这个阵列,加速度计具有较低的准确度(84%)。我们精确的策略和实际量化脑卒中患者的功能运动原语。我们提出这种优化的ML-s ensor方法可以是量化中风后训练剂量的一种方法。
translated by 谷歌翻译
据我们所知,我们报告了生成对抗网络(GAN)的第一次端到端应用,用于合成视网膜的光学相干断层扫描(OCT)图像。在给定数据类型的采样时,生成模型已经获得了他们可以合成的越来越逼真的图像的最近的注意力。在本文中,我们将GAN应用于视网膜OCT的采样分布。我们观察到现实OCT图像的合成,描绘了可识别的病理学,例如黄斑裂孔,脉络膜血管膜,近视变性,黄斑囊样水肿和中心性视网膜病变等。这是其第一次这样的报道。这项新技术的潜在应用包括手术模拟,治疗计划,疾病预测,以及加速开发新药和治疗视网膜疾病的外科手术。
translated by 谷歌翻译
具有异常脑解剖结构的图像产生自动分割技术的问题,因此ROI检测不良影响定量测量和灌注数据的视觉评估。本文介绍了一种从动态磁敏度对比灌注磁共振中获得全自动和相对准确的ROI检测的新方法,因此可以在灌注分析中得到很好的应用。在所提出的方法中,分割输出是灌注ROI的二元掩模,其具有空气像素的零值,表示非脑组织的像素和脑脊液像素。二进制掩模生成的过程开始于通过阈值处理提取低强度像素。通过从近似解剖脑位置获得强度像素信息来解决最佳低阈值。孔填充算法和二元区域生长算法用于去除错误检测区域并产生仅脑组织区域。此外,通过对来自仅仅脑组织的区域的高强度像素进行阈值处理来提供CSF像素提取。每个灌注序列的时间点图像用于CSF像素位置的调整。将分割结果与经验丰富的放射科医师进行的手动分割进行比较,作为所提方法的参考标准评估。平均120个图像的分割结果与参考标准具有良好的一致性。所有检测到的灌注ROI被两位经验丰富的放射科医师认为是令人满意的临床用途。结果表明,所提出的方法适用于DSC头部扫描的灌注ROI检测。基于所提出的方法的分割工具可以实现为用于临床的任何自动脑图像处理系统的一部分。
translated by 谷歌翻译