Very few eXplainable AI (XAI) studies consider how users understanding of explanations might change depending on whether they know more or less about the to be explained domain (i.e., whether they differ in their expertise). Yet, expertise is a critical facet of most high stakes, human decision making (e.g., understanding how a trainee doctor differs from an experienced consultant). Accordingly, this paper reports a novel, user study (N=96) on how peoples expertise in a domain affects their understanding of post-hoc explanations by example for a deep-learning, black box classifier. The results show that peoples understanding of explanations for correct and incorrect classifications changes dramatically, on several dimensions (e.g., response times, perceptions of correctness and helpfulness), when the image-based domain considered is familiar (i.e., MNIST) as opposed to unfamiliar (i.e., Kannada MNIST). The wider implications of these new findings for XAI strategies are discussed.
translated by 谷歌翻译
In order to assist the drug discovery/development process, pharmaceutical companies often apply biomedical NER and linking techniques over internal and public corpora. Decades of study of the field of BioNLP has produced a plethora of algorithms, systems and datasets. However, our experience has been that no single open source system meets all the requirements of a modern pharmaceutical company. In this work, we describe these requirements according to our experience of the industry, and present Kazu, a highly extensible, scalable open source framework designed to support BioNLP for the pharmaceutical sector. Kazu is a built around a computationally efficient version of the BERN2 NER model (TinyBERN2), and subsequently wraps several other BioNLP technologies into one coherent system. KAZU framework is open-sourced: https://github.com/AstraZeneca/KAZU
translated by 谷歌翻译
我们提出了LOC-NERF,这是一种基于实时视觉的机器人定位方法,结合了蒙特卡洛定位和神经辐射场(NERF)。我们的系统使用预先训练的NERF模型作为环境的地图,可以使用RGB摄像机作为机器人唯一的外部感受传感器实时定位。尽管神经辐射场在计算机视觉和图形中看到了重要的视觉渲染应用,但他们发现机器人技术的用途有限。现有的基于NERF的本地化方法需要良好的初始姿势猜测和重大的计算,这使得它们对于实时机器人技术应用不切实际。通过使用Monte Carlo定位作为使用NERF MAP模型估算姿势的主力,LOC-NERF能够比ART的状态更快地执行本地化,并且不依赖初始姿势估计。除了测试合成数据外,我们还使用ClearPath Jackal UGV收集的实际数据运行系统,并首次证明了使用神经光辉场进行实时全球定位的能力。我们在https://github.com/mit-spark/loc-nerf上公开代码。
translated by 谷歌翻译
随着LIDAR传感器无处不在,对LiDAR数据压缩算法的需求增加了。现代激光痛每小时会产生千兆字节的扫描数据,并且经常用于有限的计算,带宽和存储资源的应用中。我们为激光雷达范围和属性扫描序列提供了一种快速,无损的压缩算法,包括多回报范围,信号,反射率和环境红外。我们的算法(称为“ Jiffy”)通过利用时空冗余性和稀疏性来实现实质性压缩。速度是通过最大程度地利用单个指令(SIMD)指令来实现的。在自动驾驶,基础架构监控,无人机检查和手持式映射基准测试中,吉菲算法始终以单个核心的速度超过65m/sec的速度运行,始终胜过竞争的无损编解码器。在典型的自动驾驶用例中,单线程JIFFY以每秒500多次扫描以6厘米精确范围的扫描达到6倍压缩。为了确保可重复性并启用采用,该软件可以作为开源库免费提供。
translated by 谷歌翻译
策略培训是一种多学科的康复方法,它教导技能减少中风后认知障碍者的残疾。与传统的康复方法相比,在随机,对照临床试验中已显示策略培训是促进独立性的更可行和有效的干预措施。标准化的保真度评估用于通过检查康复视频记录中的指导和定向口头提示来衡量治疗原则的依从性。尽管用于检测指导和定向的口头提示的忠诚度评估对于单一站点研究是有效的,但在大型多站点务实的务实试验中,它可能会变成劳动力密集,耗时且昂贵。为了应对广泛的战略培训实施的这一挑战,我们利用自然语言处理(NLP)技术来自动化策略培训保真度评估,即自动从康复会议的视频记录中自动识别有指导和指导的口头提示。我们开发了一种基于规则的NLP算法,一个长期术语存储器(LSTM)模型以及该任务的变压器(BERT)模型的双向编码器表示。 BERT模型以0.8075的F1得分实现了最佳性能。这项研究的发现在心理学和康复干预研究和实践方面具有广泛的希望。
translated by 谷歌翻译
在进行研究,设计和系统开发时,HCI研究人员一直在将注意力从个人用户转移到社区。但是,我们的领域尚未建立对社区合并研究方法的挑战,利益和承诺的凝聚力,系统的理解。我们对47个计算研究论文进行了系统的综述和主题分析,讨论了与社区的参与性研究,以开发过去二十年来,以开发技术文物和系统。从这篇评论中,我们确定了与项目演变相关的七个主题:从建立社区伙伴关系到维持结果。我们的发现表明,这些项目的特征是几个紧张关系,其中许多与研究人员的力量和位置以及计算研究环境有关,相对于社区伙伴。我们讨论了我们的发现的含义,并提供方法论建议,以指导HCI,并更广泛地计算研究中心社区的实践。
translated by 谷歌翻译
本文介绍了BRL/PISA/IIT(BPI)SOFTHAND:单个执行器驱动的,低成本,3D打印,肌腱驱动的机器人手,可用于执行一系列掌握任务。基于PISA/IIT SOFTHAND的自适应协同作用,我们设计了一种新的关节系统和肌腱路由,以促进软化和适应性的协同作用,这有助于我们平衡手的耐用性,负担能力和握住手的性能。这项工作的重点在于该杂种的设计,仿真,协同作用和抓握测试。新颖的小块是根据连锁,齿轮对和几何约束机制设计和印刷的,可以应用于大多数肌腱驱动的机器人手。我们表明,机器人手可以成功地掌握和提起各种目标对象并适应复杂的几何形状,从而反映了软化和适应性协同的成功采用。我们打算为手的设计开放源,以便可以在家用3D打印机上廉价地构建。有关更多详细信息:https://sites.google.com/view/bpi-softhandtactile-group-bri/brlpisaiit-softhand-design
translated by 谷歌翻译
最近开发的优化方法的平均案例分析可以比通常的最坏情况结果进行更细粒度和代表性的收敛分析。作为交换,该分析需要对数据生成过程的更精确的假设,即假定与问题相关的随机矩阵的预期光谱分布(ESD)的知识。这项工作表明,ESD边缘附近的特征值的浓度决定了问题的渐近平均复杂性。与ESD的完整知识相比,有关此浓度的先验信息是一个更扎实的假设。这种近似浓度实际上是最严重的场景收敛的粗糙性与限制性的先前平均案例分析之间的中间立场。我们还引入了广义的Chebyshev方法,该方法在该浓度的假设下渐近最佳,当ESD遵循β分布时,全球最佳。我们将其性能与经典优化算法(例如梯度下降或Nesterov的方案)进行了比较,我们表明,在平均情况下,Nesterov的方法在渐近差异上几乎是最佳的。
translated by 谷歌翻译
随机梯度下降(SGD)是现代机器学习的支柱,是各种问题的首选优化算法。尽管SGD的经验成功通常归因于其计算效率和有利的概括行为,但两者都没有充分理解和解散它们仍然是一个开放的问题。即使在简单的凸二次问题的设置中,最坏情况分析也给SGD的渐近收敛率提供了不比全批梯度下降(GD)更好的,而SGD的所谓隐式正则作用缺乏精确的解释。在这项工作中,我们研究了高维凸四边形上多通sgd的动力学,并建立了与随机微分方程的渐近等效性,我们称之为同质化的随机梯度下降(HSGD),我们的解决方案我们以我们的解决方案的方式明确表征Volterra积分方程。这些结果为学习和风险轨迹提供精确的公式,该公式揭示了隐性条件的机制,该机制解释了SGD相对于GD的效率。我们还证明,来自SGD的噪声会对泛化性能产生负面影响,排除在这种情况下任何类型的隐式正则化的可能性。最后,我们展示了如何适应HSGD形式主义以包括流媒体SGD,这使我们能够针对相对于流SGD(Bootstrap风险)的多通SGD的多余风险产生确切的预测。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译