众所周知,公共特别活动,如体育比赛,音乐会和节日会造成交通系统中断,经常让操作员感到意外。虽然这些通常是提前计划好的,但即使组织者和运输经营者协调,其影响也很难预测。当几个事件同时发生时,问题会大大增加。为了解决这些问题,在新加坡,伦敦或东京等大城市,通常采用昂贵的流程,严重依赖于手动搜索和个人体验。本文介绍了一种带有高斯过程组件的贝叶斯加性模型,该模型将来自公共交通的智能卡记录与关于从Web连续挖掘的事件的上下文信息相结合。我们开发了一种有效的近似推理算法,使我们能够预测到特殊事件区域的公共交通出行总数,从而为更加适应性的交通系统做出贡献。此外,对于多个并发事件场景,所提出的算法能够将总行程计数分解为与特定事件和例行行为相关的最可能的组件。使用来自新加坡的实际数据,我们发现所呈现的模型在R2中最高可达26%的最佳基线模型,并且对其各个组件也具有解释力。
translated by 谷歌翻译
从单个图像中对面部进行三维重建的最先进方法需要2D-3D对地面实况数据进行监督。这样的数据获取成本很高,并且文献中可用的大多数数据集被限制为输入2D图像描绘近似平行的面部的对。因此,许多用于单图像3D面部重建的数据驱动方法在轮廓和近轮廓面上表现不佳。我们提出了一种方法,通过利用网络合成自己的精细调整训练数据来提高单图像3D面部重建网络的性能,包括:(i)单面图像三维重建面部的正面图像,没有地面真实的3D形状; (ii)对重建的面部模型应用刚体变换; (iii)从新观点呈现面部模型; (iv)使用渲染图像和相应的3D重建作为监督微调的附加数据。由此产生的新2D-3D对具有相同的高质量观​​察到的近平行重建,从而使网络朝向更均匀的性能。输入面的视角的函数。所提出的技术在用于面部的现有单个图像3D重建网络的微调中的应用证明了该方法的有用性,对于轮廓或特征具有特别显着的增益。近profileviews。
translated by 谷歌翻译
最近,正在成功地进行数据挖掘研究以估计各种领域中的几个参数。数据挖掘技术吸引了整个信息产业和整个社会的注意力,并且需要将大量数据转化为有用的知识。然而,在一些地区有效利用数据的情况仍然不发达,体育运动的情况也是如此,近年来,体育运动呈现出轻微的增长态势;因此,许多体育组织已经开始看到他们提取的数据中存在大量未开发的知识。因此,本文对体育数据挖掘进行了系统评述。从2010年到2018年,共发现了31种类型的研究。在这些研究的基础上,我们展示了当前的全景图,主题图,数据库,建议书,算法和研究机会。我们的研究结果提供了更好的体育数据挖掘潜力的理解,除了激励科学界探索这个及时和有趣的话题。
translated by 谷歌翻译
这项工作将用户协作与会话式个人助理进行比较。专家聊天机器人团队。进行了两项研究,以调查这些方法是否会影响任务的完成和协作成本。参与者与两个等效的财务建议聊天机器人系统进行交互,一个由一个会话顾问组成,另一个基于四个专家聊天机器人的团队。结果表明,用户有不同形式的经验,但同样能够实现他们的目标。与预期相反,有证据表明,在团队合作的情况下,用户更能够更好地预测代理行为,并且没有保持共同点的开销,表明类似的协作成本。结果指出了使用会话代理进行用户协作的两种方法中的任何一种的可行性。
translated by 谷歌翻译
对于许多学科来说,运行高分辨率物理模型在计算上是非常昂贵的。依赖于高分辨率天气模型的农业,运输和能源部门通常会消耗数小时的大型高性能计算(HPC)系统来及时提供结果。许多用户无法承受运行所需的分辨率并被迫使用低分辨率输出。一个简单的解决方案是插入可视化的结果。还可以组合低分辨率模型的集合以获得更好的预测。然而,这些方法无法捕获低分辨率输入中的冗余信息和模式,这有助于提高预测质量。在本文中,我们提出并评估基于深度神经网络的策略,以使用天气预报作为实用用例来学习低分辨率预测的高分辨率表示。我们采用监督学习方法,因为获得标记的数据可以自动完成。与标准实践相比,我们的结果显示出显着的改进,并且该策略仍然足够轻,可以在适度的计算机系统上运行。
translated by 谷歌翻译
传统的治疗方法限制了外科医生的灵活性控制,这是由于有限的视野。随着机器人辅助手术的出现,微创手术的医疗技术已经发生了范式转变。然而,在手术场景中追踪手术器械的位置是非常具有挑战性的,并且精确检测和识别手术工具是至关重要的。基于深度学习的手术视频的语义分割框架有可能促进这项任务。在这项工作中,我们通过引入经过预先训练的编码器并重新设计解码器部分来修改名为U-NetPlus的U-Net架构,方法是将转置的卷积操作替换为基于最近邻(NN)插值的上采样操作。为了进一步提高性能,我们还采用了一种非常快速且灵活的数据增强技术。我们通过MICCAI 2017EndoVis Challenge数据集对8 x 225帧机器人手术视频序列进行了框架训练,并在8 x 75帧和2 x 300帧视频上进行了测试。使用我们的U-NetPlus架构,我们报告用于二进制分割的90.20%DICE,用于仪器部分分割的76.26%DICE,以及​​用于仪器类型(即,所有仪器)分段的46.07%,优于在这些数据上实现和测试的先前技术的结果。
translated by 谷歌翻译
本文描述了针对机器翻译(MT),实体发现和链接(EDL)以及文本和语音中的情景帧(SF文本和语音)的检测的低资源人类语言技术(LoReHLT)2018评估的ARIEL-CMU提交。
translated by 谷歌翻译
已经开发了面部去识别算法以响应公共视频记录和监视摄像机的普遍使用。在这里,我们评估了在监控驾驶员的情况下身份掩蔽的成功,因为他们积极地操作机动车辆。我们比较了使用人类感知器的八种去识别算法的有效性。所测试的算法包括用于面部动作转移(FAT)的个性化监督双线性回归方法,呈现通用化身表面的DMask方法,以及使用和不使用图像极性反转(Canny,Scharr)实现的两种边缘检测方法。我们还使用了一种结合FAT和Canny方法的Overmask方法。我们比较了这些身份屏蔽方法,以识别驱动程序的未屏蔽视频。人类受试者在标准的面部识别实验中进行了测试,其中他们以高分辨率(工作室风格)图像学习驾驶员身份,并随后测试他们识别这些个人驾驶的蒙面和未掩盖视频的能力。相对于未屏蔽的视频,所有屏蔽方法基本上降低了识别准确度。最成功的方法,DMask和Canny,将人类识别性能降低到接近随机。在所有情况下,使用严格的决策标准进行鉴定,表明受试者对其决策的信心不足。我们得出结论,经过仔细测试的去识别方法,单独使用或组合使用,可以成为保护捕获的视频个人隐私的有效工具。未来的工作应该检查最有效的方法如何保持面部动作识别。
translated by 谷歌翻译
深度学习研究的长期目标是精确地描述培训和概括。然而,神经网络经常复杂的损失景观使学习动力学理论变得难以捉摸。在这项工作中,我们表明,对于广泛的神经网络,学习动力学显着简化,并且在无限宽度限制中,它们由一个线性模型控制。网络初始参数的一阶泰勒展开式。此外,镜像宽贝叶斯神经网络和高斯过程之间的对应关系,具有平方损失的宽神经网络的基于梯度的训练产生了从具有特定组成核的高斯过程绘制的测试集预测。虽然这些理论结果仅在无限宽度限制中是精确的,但我们仍然发现原始网络的预测与线性化版本的预测之间存在极好的经验一致性,即使对于有限的实际大小的网络也是如此。该协议在不同的体系结构,优化方法和损失函数方面都很强大。
translated by 谷歌翻译
据我们所知,我们报告了生成对抗网络(GAN)的第一次端到端应用,用于合成视网膜的光学相干断层扫描(OCT)图像。在给定数据类型的采样时,生成模型已经获得了他们可以合成的越来越逼真的图像的最近的注意力。在本文中,我们将GAN应用于视网膜OCT的采样分布。我们观察到现实OCT图像的合成,描绘了可识别的病理学,例如黄斑裂孔,脉络膜血管膜,近视变性,黄斑囊样水肿和中心性视网膜病变等。这是其第一次这样的报道。这项新技术的潜在应用包括手术模拟,治疗计划,疾病预测,以及加速开发新药和治疗视网膜疾病的外科手术。
translated by 谷歌翻译