我们研究了大规模实时乘车系统的优化,并提出了一种模块化设计方法,用于乘车共享的组件算法(CAR)。我们评估了一套多种汽车(总共14辆),重点是乘车共享的关键算法组件。我们采用一种多目标方法,评估了与全球效率,复杂性,乘客,驾驶员和平台激励措施有关的12个指标,以在各个方面非常类似于现实,重点介绍了能力二的工具。据我们所知,这是迄今为止最大,最全面的评估。我们(i)确定在全球,乘客,驾驶员或平台指标上表现良好的汽车,(ii)证明,轻巧的搬迁计划可以显着提高服务质量高达$ 50 \%\%$,并且(iii)强调了一种实用的,一种实用的,在所有指标中都能很好地运行,可扩展的启动汽车。
translated by 谷歌翻译
Traditional screening practices for anxiety and depression pose an impediment to monitoring and treating these conditions effectively. However, recent advances in NLP and speech modelling allow textual, acoustic, and hand-crafted language-based features to jointly form the basis of future mental health screening and condition detection. Speech is a rich and readily available source of insight into an individual's cognitive state and by leveraging different aspects of speech, we can develop new digital biomarkers for depression and anxiety. To this end, we propose a multi-modal system for the screening of depression and anxiety from self-administered speech tasks. The proposed model integrates deep-learned features from audio and text, as well as hand-crafted features that are informed by clinically-validated domain knowledge. We find that augmenting hand-crafted features with deep-learned features improves our overall classification F1 score comparing to a baseline of hand-crafted features alone from 0.58 to 0.63 for depression and from 0.54 to 0.57 for anxiety. The findings of our work suggest that speech-based biomarkers for depression and anxiety hold significant promise in the future of digital health.
translated by 谷歌翻译
视力障碍者的日常运动有重大问题。因此,我们以前的一些工作涉及计算机愿景来开发援助系统,以指导在关键情况下视力障碍。其中一些情况包括在室内和室外环境中的道路交叉路口和楼梯上的人行横道。本文为在此类关键情况下基于计算机视觉障碍的人提供了一个评估框架。提出的框架包括用于标记和存储指导方向的参考人类决策的接口,并将其与基于计算机视觉的决策进行比较。由于该研究领域中的严格评估方法并未明确定义,并且由于信息转移到视障人士的细节,因此提出了针对特定简化指导指令的评估标准。
translated by 谷歌翻译
在与人共享环境中运行的自主系统需要能够遵循他们所占据的社会的规则。尽管法律对于一个社会是独一无二的,但不同的人和机构可能会使用不同的规则来指导其行为。我们研究了可能不一致的行为规则中达到共同基础的问题。我们正式定义了共同基础的概念,并讨论了该概念的主要特性。然后,我们确定了保证存在共同点的喇叭表达式的三个足够条件。我们提供了在这些条件下计算共同基础的多项式时间算法。我们还表明,如果删除了这三个条件中的任何一个,则可能不存在结果(较大)类的共同点。
translated by 谷歌翻译
本文介绍了基于2022年国际生物识别技术联合会议(IJCB 2022)举行的基于隐私感知合成训练数据(SYN-MAD)的面部变形攻击检测的摘要。该竞赛吸引了来自学术界和行业的12个参与团队,并在11个不同的国家 /地区举行。最后,参与团队提交了七个有效的意见书,并由组织者进行评估。竞争是为了介绍和吸引解决方案的解决方案,这些解决方案涉及检测面部变形攻击的同时,同时出于道德和法律原因保护人们的隐私。为了确保这一点,培训数据仅限于组织者提供的合成数据。提交的解决方案提出了创新,导致在许多实验环境中表现优于所考虑的基线。评估基准现在可在以下网址获得:https://github.com/marcohuber/syn-mad-2022。
translated by 谷歌翻译
机器人技术中的安全运动规划需要已验证的空间规划,这些空间没有障碍。但是,由于其深度测量值的稀疏性,使用LiDARS获得此类环境表示是具有挑战性的。我们提出了一个学习辅助的3D激光雷达重建框架,该框架借助重叠的摄像头图像来为稀疏的激光雷达深度测量,以生成比单独使用原始liDar测量值可以实现更明确的自由空间的较密集的重建。我们使用带有编码器解码器结构的神经网络来预测密集的深度图像以及使用体积映射系统融合的深度不确定性估计。我们在使用手持式传感设备和腿部机器人捕获的现实世界室外数据集上进行实验。我们使用来自16束束激光雷达映射建筑网络的输入数据,我们的实验表明,通过我们的方法,估计的自由空间的量增加了40%以上。我们还表明,我们在合成数据集通用上训练的方法非常适合现实世界户外场景,而无需进行其他微调。最后,我们演示了运动计划任务如何从这些密集的重建中受益。
translated by 谷歌翻译
变形面的图像对面对识别的安全系统构成了严重威胁,因为它们可用于非法验证具有单个变形图像的多人身份。现代检测算法学会使用真实个体的真实图像来识别这种变形攻击。这种方法提出了各种隐私问题,并限制了公开培训数据的数量。在本文中,我们探讨了仅在不存在的人及其各自的形态上接受训练的检测算法的功效。为此,对两种专用算法进行了合成数据的训练,然后在三个现实世界数据集上进行了评估,即:FRLL-MORPHS,FERET-MORPHS和FRGC-MORPHS。我们的结果表明,合成的面部图像可以成功用于检测算法的训练过程,并将其概括为现实世界情景。
translated by 谷歌翻译
医疗图像分割通常需要在单个图像上分割多个椭圆对象。这包括除其他任务外,还分割了诸如轴向CTA切片的主动脉之类的容器。在本文中,我们提出了一种一般方法,用于改善这些任务中神经网络的语义分割性能,并验证我们在主动脉分割任务中的方法。我们使用两个神经网络的级联反应,其中一个基于U-NET体系结构执行粗糙的分割,另一个对输入的极性图像转换执行了最终分割。粗糙分割的连接组件分析用于构建极性变换,并且使用磁滞阈值融合了对同一图像的多个转换的预测。我们表明,这种方法可以改善主动脉分割性能,而无需复杂的神经网络体系结构。此外,我们表明我们的方法可以提高稳健性和像素级的回忆,同时根据最新的状态实现细分性能。
translated by 谷歌翻译
空中图像的语义分割是映射和地球观察的重要工具。但是,对细分的监督深度学习模型依赖大量的高质量标记数据,这是劳动密集型且耗时的生成。为了解决这个问题,我们提出了一种新方法,用于使用无人机(UAV)自主收集有用的模型培训数据。我们利用一种贝叶斯方法来估计语义分割中的模型不确定性。在任务过程中,语义预测和模型不确定性被用作地形映射的输入。管道的一个关键方面是将映射的模型不确定性与基于主动学习的机器人计划目标联系起来。这使我们能够自适应地指导无人机收集最有用的地形图像,该图像被人类标记用于模型培训。我们对现实世界数据的实验评估表明,与静态覆盖路径相比,在最大化模型性能和减少标签工作方面,使用我们的信息计划方法的好处。
translated by 谷歌翻译
如果预测模型确定了脆弱的个人或群体,则该模型的使用可能成为道德问题。但是我们能知道这就是模型的作用吗?机器学习公平作为一个领域的重点是通过机器学习方法对信息处理的个人和群体的公正处理。尽管已经非常关注缓解受保护群体的歧视,但脆弱的群体并未受到相同的关注。与受保护的群体不同,这些群体可以被视为总是脆弱的,一个脆弱的群体在一种情况下可能是脆弱的,而在另一种情况下却不是脆弱的。这引发了有关如何以及何时保护机器学习中脆弱的个人和团体的新挑战。相比之下,来自可解释的人工智能(XAI)的方法确实考虑了更多的上下文问题,并关注回答“为什么做出这一决定?”的问题。现有的公平性和现有的解释性方法都不允许我们确定预测模型是否确定漏洞。我们讨论了这个问题,并提出了在这方面分析预测模型的方法。
translated by 谷歌翻译