我们证明,可轻松获取行为的数字记录,例如Facebook Likes,可以自动区分各种高度微妙的个人特征,包括:生活满意度,文化种族,政治观点,年龄,性别和人格特征。该分析基于超过738,000名用户的数据集,他们为我们的扩展人格分析授予了他们的Facebook喜欢,社交网络活动,自我中心网络,人口统计特征以及各种心理测试的结果。所提出的模型使用Facebook Like对象之间的唯一映射技术到相应的Facebook页面类别/子类别对象,然后将其评估为用于一组机器学习算法的特征,以预测来自喜欢的个人心理 - 人口统计学概况。该模型在83%的情况下区分宗教和非宗教个体,在87%的情况下区分亚洲和欧洲,在81%的情况下区分情绪稳定和情绪不稳定。我们提供属性和喜欢之间相关性的示例,并提出未来方向的建议。
translated by 谷歌翻译
胶质瘤是最常见的原发性脑恶性肿瘤,具有不同程度的侵袭性,可变预后和各种异质性组织亚区域,即肿瘤周围水肿/侵入组织,坏死核心,活性和非增强核心。这种内在的异质性也被用于它们的放射性表型,因为它们的子区域通过在多参数磁共振成像(mpMRI)扫描中传播的不同强度分布来描绘,反映了不同的生物学特性。它们的异质形状,范围和位置是其中的一部分。使这些肿瘤难以切除的因素,在某些情况下无法手术。切除肿瘤的数量也是纵向扫描中考虑的一个因素,用于评估表观肿瘤以进行潜在的进展诊断。此外,有越来越多的证据表明,各种肿瘤亚区域的准确分割可以为定量图像分析提供预测患者整体的基础。生存。该研究评估了在国际脑肿瘤分割(BraTS)挑战的最后七个实例(即2012-2018)期间用于mpMRI扫描中的脑肿瘤图像分析的最先进的机器学习(ML)方法。具体而言,我们专注于i)评估术前mpMRI扫描中各种神经胶质瘤亚区的分割,ii)通过肿瘤亚区的纵向生长评估潜在的肿瘤进展,超出RECIST标准的使用,以及iii)预测整体术前mpMRI扫描对经历完全切除的患者的生存率。最后,我们研究了为每个任务确定最佳ML算法的挑战,考虑到除了在每个挑战实例上多样化之外,多机构mpMRI BraTS数据集也是一个不断发展/不断发展的数据集。
translated by 谷歌翻译
我们提出了神经图 - 基于深度神经网络的表示,用于理解音频信号,顾名思义,它基于通过自然结构学习的嵌入将音频信号转换为密集,紧凑的表示。通过一系列探测信号,我们展示了我们的代表性如何封装音高,音色和基于节奏的信息以及其他属性。该表示提出了一种用于在任意长的音频信号中揭示有意义的关系的方法,该信号不易被现有算法表示。这有可能在音频理解,音乐推荐,元数据提取等众多应用中得到广泛应用。
translated by 谷歌翻译
非线性机器学习模型通常会因缺乏可解释性而牺牲一个很好的预测性能。然而,模型不可知解释技术现在允许我们估计任何预测模型的特征的影响和重要性。不同的符号和术语使他们的理解以及它们如何相关变得复杂。缺少对这些方法的统一观点。我们提出了广义SIPA(采样,干预,预测,聚合)工作阶段框架,用于模式诊断解释技术,并演示如何将几个突出的特征效应方法嵌入到提议的框架中。 Wealso正式引入预先存在的边际效应来描述黑盒模型的特征效应。此外,我们通过指出基于方差和基于性能的重要性度量如何基于相同的工作阶段,将框架扩展到特征重要性计算。广义框架可以作为在机器学习中进行模型不可知解释的指导。
translated by 谷歌翻译
在多发性硬化症中检测新的或扩大的白质病变是监测患有多发性硬化症的疾病修复治疗的患者的重要任务。然而,“新的或扩大的”的定义并不固定,并且已知病变计数是高度主观的,具有高度的内部和内部评估者可变性。用于病变量化的自动化方法具有使新的和扩大的检测一致且可重复的潜力。然而,尽管这是一个紧迫的临床用例,但大多数病变分段算法并未评估其分离进展性稳定患者的能力。在本文中,我们发现,即使对于高性能分离方法,单独损伤负荷的体积测量的变化也不是执行该分离的良好方法。相反,我们提出了一种识别高确定性病变的方法,并在纵向多发性硬化病例的数据集上确定该方法能够将进展与稳定时间点分离,具有非常高的辨别水平(AUC = 0.99),而病变体积的变化是执行这种分离的能力要低得多(AUC = 0.71)。对第二个外部数据集的方法进行验证,证实该方法能够超出其训练的范围,在分离稳定和渐进的时间点时达到83%的准确度。先前已经证明病变体积和计数都是人群中疾病的强有力预测因子。然而,我们证明对于个体患者而言,这些措施的变化并不是确定疾病活动证据的充分手段。同时,直接检测高可信度地从非病变到病变的组织是用于鉴定放射学活跃患者的可行方法。
translated by 谷歌翻译
目前,数字地图对于自动驾驶是必不可少的。然而,由于GNSS的低精度和可靠性,特别是在城市地区,融合独立记录会话和不同地区的轨迹是一项具有挑战性的任务。为了避免直接结合GNSS测量用于地理参考的缺陷,航空影像的使用似乎很有希望。此外,更准确的地理参考提高了全球地图精度并允许估计传感器校准误差。在本文中,我们提出了一种新的地理参考方法,用于使用极点和道路标记将轨迹与航拍图像对齐。为了将来自传感器观察的提取特征与航空影像地标稳健地匹配,基于RANSAC的匹配方法应用于滑动窗口。为此,我们假设轨迹通常参考图像,这可以通过来自低成本GNSS接收器的粗略GNSS测量来实现。最后,我们通过最小化包括所有确定的匹配的几何成本函数,将初始轨迹精确地对准航拍图像。对德国卡尔斯鲁厄的数据记录进行的评估显示,我们的算法产生的轨迹准确地参考了所使用的航空影像。
translated by 谷歌翻译
正式道德领域正在经历从独特或标准方法到规范推理的转变,例如所谓的标准化学,以及各种特定应用理论。然而,正如义务,许可,禁止和道德承诺这样的规范性概念的充分处理是具有挑战性的,正如臭名昭着的道德逻辑悖论所说明的那样。在本文中,我们介绍了一种设计和评估规范推理理论的方法。特别是,我们提出了一个基于高阶逻辑的正式框架,一个设计方法,并讨论了工具支持。此外,我们使用一个实现的例子说明了这个方法,我们演示了使用它的不同方法,并讨论了如何设计现在,非专业用户和开发人员可以访问规范理论。
translated by 谷歌翻译
从其氨基酸序列推断蛋白质的结构特性是生物学中具有挑战性但重要的问题。结构对于绝大多数蛋白质序列是未知的,但结构对于理解功能是至关重要的。用于检测来自序列的蛋白质之间的结构相似性的现有方法在序列分歧太远时不能识别和利用结构模式,限制了我们在结构相关蛋白质之间转移知识的能力。我们通过表示学习的镜头重新解决这个问题。我们引入了一个框架,将蛋白质序列映射到一个载体嵌入序列 - 每个氨基酸位置一个 - 编码结构信息。我们在蛋白质序列上训练双向长短期记忆(LSTM)模型,其具有两部分反馈机制,其结合来自(i)蛋白质之间的全局结构相似性和(ii)个体蛋白质的成对残基接触图的信息。为了能够从结构相似性信息中学习,我们基于它们之间的软对称排列(SSA)定义了任意长度的vectorembedding序列之间的新的相似性度量。尽管缺乏对序列之间位置水平对应的直接观察,我们的方法能够学习有用的位置特异性嵌入。我们证明了我们的多任务框架优于其他基于序列的方法,甚至是在预测结构相似性时我们的目标也是表现最佳的基于结构的对齐方法。最后,我们证明了我们学到的嵌入可以转移到其他蛋白质序列问题,从而改进了跨膜结构域预测的最新技术水平。
translated by 谷歌翻译
研究了在高维输入和目标数据学习框架中使用正交投影。首先,我们研究了两个标准目标在降维,最大化方差和保持成对相对距离方面的关系。它们的渐近相关和数值实验的推导表明,预测通常不能满足两个目标。在标准分类问题中,我们确定输入数据的投影,以平衡它们并比较后续结果。接下来,我们将正交投影的应用扩展到深度学习框架。我们引入了新的变分损失函数,可以通过目标数据的变换和投影来集成其他信息。在两个监督学习问题,临床图像分割和音乐信息分类中,所提出的损失函数的应用提高了准确性。
translated by 谷歌翻译
找出观察到的影响的原因和建立事件之间的因果关系是(并且一直是)科学和哲学的基本要素。可以检测因果关系的自动化方法是非常受欢迎的,但是可以推断因果关系的实用方法很难找到,也是正在进行的研究的主题。虽然香农信息仅检测相关性,但有一些信息理论概念“有向信息”已成功检测到某些系统中的因果关系,特别是在神经科学界。然而,最近的工作表明,某些定向信息测量有时可能无法充分估计因果关系的程度,甚至无法识别系统组件之间存在的因果关系,特别是如果神经元以加密方式影响效应神经元。在这里,我们测试加密逻辑在进化过程中出现的频率,该过程为两个基本认知任务生成人工神经回路:运动检测和声音定位。我们的研究结果表明,转移因果关系的熵测量是否具有误导性,在很大程度上取决于所考虑的认知任务。这些结果强调了理解有助于认知处理的基本逻辑过程的重要性,并量化它们在任何给定神经系统中的相关性。
translated by 谷歌翻译