人们对连续可穿戴生命体征传感器的兴趣越来越大,用于在家中远程监测患者。这些监视器通常与警报系统耦合,当生命体征测量值落在预定义的正常范围之外时,它会触发。生命体征的趋势(例如心率提高)通常表明健康状况恶化,但很少被纳入警报系统中。在这项工作中,我们提出了一种新型的离群检测算法,以识别这种异常生命体征趋势。我们引入了一种基于距离的措施,以比较生命体征轨迹。对于我们数据集中的每个患者,我们将生命体征时间序列分为180分钟的非重叠时期。然后,我们使用动态时间扭曲距离计算了所有时期对之间的距离。每个时期的特征都以其平均成对距离(平均链路距离)到所有其他时期,其距离为较大的距离。我们将此方法应用于1561多个患者小时的飞行员数据集,这些数据集是从最近在Covid-19收缩后出院的8例患者的1561个患者小时。我们表明,离群值时期与后来入院的患者相对应。我们还描述了一个这样的患者如何从正常异常转变为异常。
translated by 谷歌翻译
尽管电子健康记录是生物医学研究的丰富数据来源,但这些系统并未在医疗环境中统一地实施,并且由于医疗保健碎片化和孤立的电子健康记录之间缺乏互操作性,可能缺少大量数据。考虑到缺少数据的案例的删除可能会在随后的分析中引起严重的偏见,因此,一些作者更喜欢采用多重插补策略来恢复缺失的信息。不幸的是,尽管几项文献作品已经通过使用现在可以自由研究的任何不同的多个归档算法记录了有希望的结果,但尚无共识,MI算法效果最好。除了选择MI策略之外,归纳算法及其应用程序设置的选择也至关重要且具有挑战性。在本文中,受鲁宾和范布伦的开创性作品的启发,我们提出了一个方法学框架,可以应用于评估和比较多种多个插补技术,旨在选择用于计算临床研究工作中最有效的推断。我们的框架已被应用于验证和扩展较大的队列,这是我们在先前的文献研究中提出的结果,我们在其中评估了关键患者的描述符和Covid-19的影响在2型糖尿病患者中的影响,其数据为2型糖尿病,其数据为2型糖尿病由国家共同队列合作飞地提供。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
制定了具有机器学习模拟(骆驼)项目的宇宙学和天体物理学,通过数千名宇宙的流体动力模拟和机器学习将宇宙学与天体物理学结合起来。骆驼包含4,233个宇宙学仿真,2,049个n-body和2,184个最先进的流体动力模拟,在参数空间中采样巨大的体积。在本文中,我们介绍了骆驼公共数据发布,描述了骆驼模拟的特性和由它们产生的各种数据产品,包括光环,次麦,银河系和空隙目录,功率谱,Bispectra,Lyman - $ \ Alpha $光谱,概率分布函数,光环径向轮廓和X射线光子列表。我们还释放了超过骆驼 - 山姆的数十亿个星系的目录:与Santa Cruz半分析模型相结合的大量N身体模拟。我们释放包含350多个Terabytes的所有数据,并包含143,922个快照,数百万光环,星系和摘要统计数据。我们提供有关如何访问,下载,读取和处理数据AT \ URL {https://camels.readthedocs.io}的进一步技术详细信息。
translated by 谷歌翻译
鉴于问题的复杂性,从各种传感器模式到高度纠缠的对象布局,再到多样化的项目属性和抓地力类型,因此对视觉驱动的机器人系统提出了重大挑战。现有方法通常从一个角度解决问题。各种项目和复杂的垃圾箱场景需要多种选择策略以及高级推理。因此,要构建可靠的机器学习算法来解决这项复杂的任务,需要大量的全面和高质量的数据。在现实世界中收集此类数据将太昂贵,时间过高,因此从可伸缩性角度来看。为了解决这个大型,多样化的数据问题,我们从最近的元素概念上的增长中获得了灵感,并引入了MetagraspNet,这是一种通过基于物理学的元合成构建的大规模的照片现实垃圾箱挑选数据集。所提出的数据集在82种不同的文章类型上包含217K RGBD图像,并具有完整的注释,可用于对象检测,Amodal感知,关键点检测,操纵顺序和平行jaw和真空吸尘器的Ambidextrous Grasp标签。我们还提供了一个真实的数据集,该数据集由超过2.3k全面注释的高质量RGBD图像组成,分为5个困难级别和一个看不见的对象,以评估不同的对象和布局属性。最后,我们进行了广泛的实验,表明我们提出的真空密封模型和合成数据集实现了最先进的性能,并将其推广到现实世界用例。
translated by 谷歌翻译
时间序列形状是最近发现对时间序列聚类有效(TSC)有效的歧视子序列。形状方便地解释簇。因此,TSC的主要挑战是发现高质量的可变长度形状以区分不同的簇。在本文中,我们提出了一种新型的自动编码器窗帘方法(AutoShape),这是第一次利用自动编码器和塑形器以不受欢迎的方式确定形状的研究。自动编码器的专门设计用于学习高质量的形状。更具体地说,为了指导潜在的表示学习,我们采用了最新的自我监督损失来学习不同变量的可变长度塑形塑形(时间序列子序列)的统一嵌入,并提出多样性损失,以选择歧视嵌入的嵌入方式统一空间。我们介绍了重建损失,以在原始时间序列空间中恢复形状,以进行聚类。最后,我们采用Davies Bouldin指数(DBI),将学习过程中的聚类性能告知AutoShape。我们介绍了有关自动赛的广泛实验。为了评估单变量时间序列(UTS)的聚类性能,我们将AutoShape与使用UCR存档数据集的15种代表性方法进行比较。为了研究多元时间序列(MTS)的性能,我们使用5种竞争方法评估了30个UEA档案数据集的AutoShape。结果证明了AutoShape是所有比较的方法中最好的。我们用形状来解释簇,并可以在三个UTS案例研究和一个MTS案例研究中获得有关簇的有趣直觉。
translated by 谷歌翻译
激光间质热疗法(LITT)是一种新型的微创治疗方法,用于烧蚀颅内结构,以治疗肠内颞叶癫痫(MTLE)。 LITT之前和之后的感兴趣区域(ROI)分割将使自动化病变定量能够客观地评估治疗疗效。深度学习技术,例如卷积神经网络(CNN)是ROI分割的最新解决方案,但在培训过程中需要大量注释的数据。但是,从LITT等新兴治疗中收集大型数据集是不切实际的。在本文中,我们提出了一个进行性脑部病变合成框架(PAVAE),以扩大训练数据集的数量和多样性。具体而言,我们的框架由两个顺序网络组成:掩模合成网络和掩模引导的病变合成网络。为了更好地利用外部信息来在网络培训期间提供额外的监督,我们设计了条件嵌入块(CEB)和掩模嵌入块(MEB),以将掩模的固有条件编码到功能空间中。最后,使用原始和合成病变图像对分割网络进行训练,以评估所提出的框架的有效性。实验结果表明,我们的方法可以实现逼真的合成结果,并在传统数据增强技术之上提高下游分割任务的性能。
translated by 谷歌翻译
气候变化正在增加有害藻华(HAB)的频率和严重程度,这些藻类在水产养殖场中造成大量鱼类死亡。这有助于海洋污染和温室气体(GHG)的排放,因为死鱼要么被倾倒到海洋中,要么被带到垃圾填埋场,进而对气候产生负面影响。当前,列举有害藻类和其他浮游植物的标准方法是在显微镜下手动观察并对其进行计数。这是一个耗时,乏味且容易出错的过程,导致农民的管理决定妥协。因此,自动化此过程以进行快速准确的HAB监控非常有帮助。但是,这需要大量且多样化的浮游植物图像数据集,并且这些数据集很难快速生产。在这项工作中,我们探讨了产生新型高分辨率的光真逼真的合成浮游植物图像的可行性,这些图像包含相同图像中的多个物种,并且给定了一小部分真实图像。为此,我们采用生成的对抗网络(GAN)来生成合成图像。我们使用标准图像质量指标评估了三种不同的GAN架构:ProjectedGan,Fastgan和styleganv2。我们从经验上显示了仅使用961个真实图像的训练数据集的高保真合成浮游植物图像的产生。因此,这项工作证明了甘斯从小型培训数据集中创建大型浮游植物的大型合成数据集的能力,从而朝着可持续的系统监测有害藻类绽放迈出了关键的一步。
translated by 谷歌翻译
时尚兼容性模型使在线零售商可以轻松获得质量良好的大量服装作品。但是,有效的时尚建议需要更深入的时尚认知,为每个客户提供精确的服务。在本文中,我们进行了有关时尚认知学习的首次研究,这是以个人物理信息为条件的时尚建议。为此,我们提出了一个时尚认知网络(FCN),以了解服装组成的视觉语义嵌入和个人外观特征之间的关系。 FCN包含两个子模块,即装备编码器和多标签图神经网络(ML-GCN)。服装编码器使用卷积层将衣服编码到服装嵌入中。后一个模块通过堆叠的GCN学习标签分类器。我们对新收集的O4U数据集进行了广泛的实验,结果提供了有力的定性和定量证据,使我们的框架优于替代方法。
translated by 谷歌翻译
多步兵的操纵任务(例如打开推动的儿童瓶)需要机器人来做出各种计划选择,这些选择受到在任务期间施加力量的要求所影响的各种计划。机器人必须推荐与动作顺序相关的离散和连续选择,例如是否拾取对象以及每个动作的参数,例如如何掌握对象。为了实现计划和执行有力的操纵,我们通过限制了扭矩和摩擦限制,通过拟议的有力的运动链约束来增强现有的任务和运动计划者。在三个领域,打开一个防儿童瓶,扭动螺母并切割蔬菜,我们演示了系统如何从组合组合组合中进行选择。我们还展示了如何使用成本敏感的计划来查找强大的策略和参数物理参数的不确定性。
translated by 谷歌翻译