半eme被定义为人类语言的最低语义单元。半知识库(KBS)包含带有Sememes的单词的单词,已成功应用于许多NLP任务,我们相信,通过学习最小的含义单位,计算机可以更容易理解人类的语言。但是,现有的sememe kb仅基于手动注释,人类注释具有个人理解偏见,并且随着时间的流逝,词汇的含义将不断更新和改变,而人为的方法并不总是实用的。为了解决这个问题,我们提出了一种基于深群集网络(DCN)的无监督方法来构建半eme KB,您可以使用任何语言通过此方法来构建KB。我们首先学习多语言单词的分布式表示形式,使用缪斯在单个矢量空间中对齐它们,通过自我发项机制学习每个单词的多层含义,并使用DNC来群集半eme。最后,我们仅使用英语的10维半度空间完成了预测。我们发现,低维空间仍然可以保留SEMEMES的主要特征。
translated by 谷歌翻译