在使用这些模型的系统中,数据中存在的性别偏差会反映在哪些语言模型中进行培训。该模型的内在性别偏见显示了我们文化中妇女的过时和不平等的看法,并鼓励歧视。因此,为了建立更公平的系统并提高公平性,识别和减轻这些模型中存在的偏见至关重要。尽管这一领域的英语工作大量工作,但在其他性别和低资源语言,尤其是印度语言中,缺乏研究。英语是一种非性别语言,它具有无性别名词。英语中偏见检测的方法论不能直接用其他性别语言来部署,语法和语义有所不同。在我们的论文中,我们衡量与印地语语言模型中职业相关的性别偏见。我们在本文中的主要贡献是构建一种新型语料库,以评估印地语中的职业性别偏见,使用定义明确的度量来量化这些系统中现有的偏见,并通过有效地微调我们的模型来减轻它。我们的结果反映出,我们提出的缓解技术的引入后减少了偏见。我们的代码库可公开使用。
translated by 谷歌翻译