智能论文笔记

Communication Size Reduction of Federated Learning based on Neural ODE Model

Yuto Hoshino , Hiroki Kawakami , Hiroki Matsutani

分类：机器学习

2022-08-19

联合学习是一种机器学习方法，其中未在服务器上汇总数据，而是根据安全性和隐私性分配给边缘。 Resnet是一个经典但代表性的神经网络，通过学习将输入和输出加在一起的残留功能，成功地加深了神经网络。在联合学习中，服务器和边缘设备之间执行交流以交换权重参数，但是Resnet具有深层和大量参数，因此通信大小变得很大。在本文中，我们将神经颂歌用作重新设计的轻量级模型，以减少联合学习中的沟通规模。此外，我们使用具有不同数量的迭代的神经ODE模型新引入了灵活的联合学习，这与具有不同深度的重新连接相对应。 CIFAR-10数据集用于评估中，与RESNET相比，神经ODE的使用将通信大小降低了约90％。我们还表明，提出的灵活联合学习可以与不同的迭代计数合并模型。

translated by 谷歌翻译

Orthogonal Series Estimation for the Ratio of Conditional Expectation Functions

Kazuhiko Shinoda , Takahiro Hoshino

分类： (统计)机器学习

2022-12-26

In various fields of data science, researchers are often interested in estimating the ratio of conditional expectation functions (CEFR). Specifically in causal inference problems, it is sometimes natural to consider ratio-based treatment effects, such as odds ratios and hazard ratios, and even difference-based treatment effects are identified as CEFR in some empirically relevant settings. This chapter develops the general framework for estimation and inference on CEFR, which allows the use of flexible machine learning for infinite-dimensional nuisance parameters. In the first stage of the framework, the orthogonal signals are constructed using debiased machine learning techniques to mitigate the negative impacts of the regularization bias in the nuisance estimates on the target estimates. The signals are then combined with a novel series estimator tailored for CEFR. We derive the pointwise and uniform asymptotic results for estimation and inference on CEFR, including the validity of the Gaussian bootstrap, and provide low-level sufficient conditions to apply the proposed framework to some specific examples. We demonstrate the finite-sample performance of the series estimator constructed under the proposed framework by numerical simulations. Finally, we apply the proposed method to estimate the causal effect of the 401(k) program on household assets.

translated by 谷歌翻译

nLMVS-Net: Deep Non-Lambertian Multi-View Stereo

Kohei Yamashita , Yuto Enyo , Shohei Nobuhara , Ko Nishino

分类：计算机视觉

2022-07-25

我们介绍了一种新型的多视图立体声（MVS）方法，该方法不仅可以同时恢复每个像素深度，而且还可以恢复表面正常状态，以及在已知但自然照明下捕获的无纹理，复杂的非斜面表面的反射。我们的关键想法是将MVS作为端到端的可学习网络，我们称为NLMVS-NET，该网络无缝地集成了放射线线索，以利用表面正常状态作为视图的表面特征，以实现学习成本量的构建和过滤。它首先通过新颖的形状从阴影网络估算出每个视图的像素概率密度。然后，这些每个像素表面正常密度和输入多视图图像将输入到一个新颖的成本量滤波网络中，该网络学会恢复每个像素深度和表面正常。通过与几何重建交替进行交替估计反射率。对新建立的合成和现实世界数据集进行了广泛的定量评估表明，NLMVS-NET可以稳健而准确地恢复自然设置中复杂物体的形状和反射率。

translated by 谷歌翻译

Acoustic Modeling for End-to-End Empathetic Dialogue Speech Synthesis Using Linguistic and Prosodic Contexts of Dialogue History

Yuto Nishimura , Yuki Saito , Shinnosuke Takamichi , Kentaro Tachibana , Hiroshi Saruwatari

分类：自然语言处理 | 机器学习

2022-06-16

我们提出了一个端到端的移情对话言语综合（DSS）模型，该模型既考虑对话历史的语言和韵律背景。同理心是人类积极尝试进入对话中的对话者，而同理心DSS是在口语对话系统中实施此行为的技术。我们的模型以语言和韵律特征的历史为条件，以预测适当的对话环境。因此，可以将其视为传统基于语言 - 基于语言的对话历史建模的扩展。为了有效地培训善解人意的DSS模型，我们研究1）通过大型语音语料库预审预测的一个自我监督的学习模型，2）一种风格引导的培训，使用韵律嵌入对话上下文嵌入的当前话语，3）对结合文本和语音方式的跨模式的关注，以及4）句子的嵌入，以实现细粒度的韵律建模，而不是通过话语建模。评估结果表明，1）仅考虑对话历史的韵律环境并不能提高善解人意的DSS中的语音质量和2）引入样式引导的培训和句子嵌入模型的言语质量比传统方法更高。

translated by 谷歌翻译

Gaussian Fourier Pyramid for Local Laplacian Filter

Yuto Sumiya , Tomoki Otsuka , Yoshihiro Maeda , Norishige Fukushima

分类：计算机视觉

2022-06-08

多尺度处理对于图像处理和计算机图形至关重要。光环是多尺度处理中的核心问题。通过扩展Laplacian金字塔以具有边缘保留特性，几种边缘保护分解可以解决局部拉普拉斯滤波（LLF）。它的处理成本很高；因此，提出了快速LLF的近似加速度，以线性插值多个拉普拉斯金字塔。本文通过傅立叶系列扩展进一步提高了精度，称为傅立叶LLF。我们的结果表明，对于相同数量的金字塔，傅立叶LLF具有更高的精度。此外，傅立叶LLF表现出用于内容自适应过滤的参数自适应性能。该代码可在以下网址获得：https：//norishigefukushima.github.io/gaussianfourierpyramid/。

translated by 谷歌翻译

STUDIES: Corpus of Japanese Empathetic Dialogue Speech Towards Friendly Voice Agent

Yuki Saito , Yuto Nishimura , Shinnosuke Takamichi , Kentaro Tachibana , Hiroshi Saruwatari

分类：人工智能 | 自然语言处理 | 机器学习

2022-03-28

我们提出了研究，这是一种新的演讲语料库，用于开发一个可以以友好方式讲话的语音代理。人类自然会控制他们的言语韵律以相互同情。通过将这种“同情对话”行为纳入口语对话系统，我们可以开发一个可以自然响应用户的语音代理。我们设计了研究语料库，以包括一位演讲者，他明确地对对话者的情绪表示同情。我们描述了构建善解人意的对话语音语料库的方法论，并报告研究语料库的分析结果。我们进行了文本到语音实验，以最初研究如何开发更多的自然语音代理，以调整其口语风格，以对应对话者的情绪。结果表明，对话者的情绪标签和对话上下文嵌入的使用可以与使用代理商的情感标签相同的自然性产生语音。我们的研究项目页面是http://sython.org/corpus/studies。

translated by 谷歌翻译

Bayesian data combination model with Gaussian process latent variable model for mixed observed variables under NMAR missingness

Masaki Mitsuhiro , Takahiro Hoshino

分类： (统计)机器学习

2021-09-01

在社会科学和企业中观测数据的分析中，难以获得“（准）单源数据集”，其中同时观察到感兴趣的变量。相反，通常针对不同的个体或单位获取多源数据集。已经提出了各种方法来研究每个数据集中的变量之间的关系，例如匹配和潜在的变量建模。有必要利用这些数据集作为具有缺失变量的单源数据集。现有方法假设要集成的数据集是从相同的人群中获取，或者采样取决于协变量。在缺失方面，这种假设被称为随机（MAR）缺失。然而，正如在应用研究中所示的那样，这一假设可能不会在实际数据分析中保持，并且获得的结果可能偏置。我们提出了一种数据融合方法，不认为数据集是均匀的。我们使用用于非MAR缺失数据的高斯过程潜变量模型。该模型假设关注的变量和缺失的概率取决于潜在变量。模拟研究和实际数据分析表明，具有缺失数据机制和潜在高斯过程的提出方法产生有效估计，而现有方法提供严重偏置的估计。这是第一研究，其中在数据融合问题中的可谐振假设下考虑并解决了对数据集的非随机分配。

translated by 谷歌翻译