智能论文笔记

Which Factors Drive Open Access Publishing? A Springer Nature Case Study

Fakhri Momeni , Stefan Dietze , Philipp Mayr , Kristin Biesenbender , Isabella Peters

分类：机器学习

2022-08-17

开放访问（OA）有助于访问文章。但是，作者或资助者通常必须支付出版费用，以防止没有参加OA出版和参与OA文章的引文优势的作者。 OA可能会加剧出版系统中现有的不平等现象，而不是克服它们。为了调查这一点，我们研究了Springer Nature发表的522,664篇文章。采用统计方法，我们描述了与来自不同收入水平的国家 /地区的作者之间的关系，其出版选择（OA或封闭式访问）以及论文的引用影响。一种机器学习分类方法帮助我们探索了作者的OA出版与属性之间的关联，尤其是有资格获得APC Waivers或折扣，期刊，国家和论文。结果表明，与其他作者相比，有资格获得APC-Waivers的作者在Gold-Oa-Journals上发布更多。相比之下，有资格获得APC折扣的作者的OA出版物比率最低，从而假设这种折扣不足以激发作者在Gold-Oa-Journal中发布。期刊的排名是在金色杂志上发布的重要驱动力，而OA选项大多是在混合期刊中避免的。资历，OA出版物的经验以及科学领域是OA出版物中最具决定性的因素。

translated by 谷歌翻译

Predicting article quality scores with machine learning: The UK Research Excellence Framework

Mike Thelwall , Kayvan Kousha , Mahshid Abdoli , Emma Stuart , Meiko Makita , Paul Wilson , Jonathan Levitt , Petr Knoth , Matteo Cancellieri

分类：人工智能

2022-12-11

National research evaluation initiatives and incentive schemes have previously chosen between simplistic quantitative indicators and time-consuming peer review, sometimes supported by bibliometrics. Here we assess whether artificial intelligence (AI) could provide a third alternative, estimating article quality using more multiple bibliometric and metadata inputs. We investigated this using provisional three-level REF2021 peer review scores for 84,966 articles submitted to the UK Research Excellence Framework 2021, matching a Scopus record 2014-18 and with a substantial abstract. We found that accuracy is highest in the medical and physical sciences Units of Assessment (UoAs) and economics, reaching 42% above the baseline (72% overall) in the best case. This is based on 1000 bibliometric inputs and half of the articles used for training in each UoA. Prediction accuracies above the baseline for the social science, mathematics, engineering, arts, and humanities UoAs were much lower or close to zero. The Random Forest Classifier (standard or ordinal) and Extreme Gradient Boosting Classifier algorithms performed best from the 32 tested. Accuracy was lower if UoAs were merged or replaced by Scopus broad categories. We increased accuracy with an active learning strategy and by selecting articles with higher prediction probabilities, as estimated by the algorithms, but this substantially reduced the number of scores predicted.

translated by 谷歌翻译

Analyzing the State of Computer Science Research with the DBLP Discovery Dataset

Lennart Küll

分类：自然语言处理

2022-12-01

The number of scientific publications continues to rise exponentially, especially in Computer Science (CS). However, current solutions to analyze those publications restrict access behind a paywall, offer no features for visual analysis, limit access to their data, only focus on niches or sub-fields, and/or are not flexible and modular enough to be transferred to other datasets. In this thesis, we conduct a scientometric analysis to uncover the implicit patterns hidden in CS metadata and to determine the state of CS research. Specifically, we investigate trends of the quantity, impact, and topics for authors, venues, document types (conferences vs. journals), and fields of study (compared to, e.g., medicine). To achieve this we introduce the CS-Insights system, an interactive web application to analyze CS publications with various dashboards, filters, and visualizations. The data underlying this system is the DBLP Discovery Dataset (D3), which contains metadata from 5 million CS publications. Both D3 and CS-Insights are open-access, and CS-Insights can be easily adapted to other datasets in the future. The most interesting findings of our scientometric analysis include that i) there has been a stark increase in publications, authors, and venues in the last two decades, ii) many authors only recently joined the field, iii) the most cited authors and venues focus on computer vision and pattern recognition, while the most productive prefer engineering-related topics, iv) the preference of researchers to publish in conferences over journals dwindles, v) on average, journal articles receive twice as many citations compared to conference papers, but the contrast is much smaller for the most cited conferences and journals, and vi) journals also get more citations in all other investigated fields of study, while only CS and engineering publish more in conferences than journals.

translated by 谷歌翻译

YouTube and Science: Models for Research Impact

Abdul Rahman Shaikh , Hamed Alhoori , Maoyuan Sun

分类：机器学习

2022-09-01

在过去的十年中，视频通信一直在迅速增加，YouTube提供了一种媒介，用户可以在其中发布，发现，共享和反应视频。引用研究文章的视频数量也有所增加，尤其是因为学术会议需要进行视频提交已变得相对普遍。但是，研究文章与YouTube视频之间的关系尚不清楚，本文的目的是解决此问题。我们使用YouTube视频创建了新的数据集，并在各种在线平台上提到了研究文章。我们发现，视频中引用的大多数文章都与医学和生物化学有关。我们通过统计技术和可视化分析了这些数据集，并建立了机器学习模型，以预测（1）视频中是否引用了研究文章，（2）视频中引用的研究文章是否达到了一定程度的知名度，以及（3）引用研究文章的视频是否流行。最佳模型的F1得分在80％至94％之间。根据我们的结果，在更多推文和新闻报道中提到的研究文章有更高的机会接收视频引用。我们还发现，视频观点对于预测引用和增加研究文章的普及和公众参与科学很重要。

translated by 谷歌翻译

The Harvard USPTO Patent Dataset: A Large-Scale, Well-Structured, and Multi-Purpose Corpus of Patent Applications

Mirac Suzgun , Luke Melas-Kyriazi , Suproteem K. Sarkar , Scott Duke Kominers , Stuart M. Shieber

分类：自然语言处理 | 机器学习

2022-07-08

创新是经济和社会发展的主要驱动力，有关多种创新的信息嵌入了专利和专利申请的半结构化数据中。尽管在专利数据中表达的创新的影响和新颖性很难通过传统手段来衡量，但ML提供了一套有希望的技术来评估新颖性，汇总贡献和嵌入语义。在本文中，我们介绍了Harvard USPTO专利数据集（HUPD），该数据集是2004年至2004年之间提交给美国专利商业办公室（USPTO）的大型，结构化和多用途的英语专利专利申请。 2018年。HUPD拥有超过450万张专利文件，是可比的Coldia的两到三倍。与以前在NLP中提出的专利数据集不同，HUPD包含了专利申请的发明人提交的版本（不是授予专利的最终版本），其中允许我们在第一次使用NLP方法进行申请时研究专利性。它在包含丰富的结构化元数据以及专利申请文本的同时也很新颖：通过提供每个应用程序的元数据及其所有文本字段，数据集使研究人员能够执行一组新的NLP任务，以利用结构性协变量的变异。作为有关HUPD的研究类型的案例研究，我们向NLP社区（即专利决策的二元分类）介绍了一项新任务。我们还显示数据集中提供的结构化元数据使我们能够对此任务进行概念转移的明确研究。最后，我们演示了如何将HUPD用于三个其他任务：专利主题领域的多类分类，语言建模和摘要。

translated by 谷歌翻译

Quantifying the Online Long-Term Interest in Research

Murtuza Shahzad , Hamed Alhoori , Reva Freedman , Shaikh Abdul Rahman

分类：人工智能 | 机器学习

2022-09-13

在多个在线平台上的数量越来越多。尽管这些文章的学术影响得到了广泛的研究，但在线分享的在线兴趣仍不清楚。认识到在线提到的研究文章的时间对研究人员来说可能是有价值的信息。在本文中，我们分析了用户共享和/或讨论学术文章的多个社交媒体平台。我们建立了三个论文集群，根据年度在线提及的出版日期，范围从1920年到2016年。使用这三个群集中的每个集群使用在线社交媒体指标，我们构建了机器学习模型来预测长期的机器学习模型在线对研究文章的兴趣。我们采用两种不同的方法来解决预测任务：回归和分类。对于回归方法，多层感知器模型表现最好，对于分类方法，基于树的模型的性能比其他模型更好。我们发现，在经济和工业的背景下（即专利），旧文章最为明显。相比之下，最近发表的文章在研究平台（即Mendeley）之后是社交媒体平台（即Twitter）最为明显。

translated by 谷歌翻译

Team Power Dynamics and Team Impact: New Perspectives on Scientific Collaboration using Career Age as a Proxy for Team Power

Huimin Xu , Yi Bu , Meijun Liu , Chenwei Zhang , Mengyi Sun , Yi Zhang , Eric Meyer , Eduardo Salas , Ying Ding

分类：人工智能

2021-08-09

权力是一个不可避免的尚未识别的协作元素。权力动力学影响科学合作的各个方面。团队电力动力学可以通过团队功率级和团队电力层次结构来衡量。团队功率水平概念化为拥有资源，专业知识或团队决策权的平均水平。团队权力层次结构代表了团队中资源财产的垂直差异。在科学科学中，很少有研究从团队权力动力学的角度看过科学合作。本研究探讨了团队权力动力学如何影响团队的影响，以填补研究差距。在这项研究中，一个出版物的所有共同作者被视为一个团队。一支队伍的团队电力水平和团队电力层次由本团队共同作者的职业年龄的平均值和基尼指数来衡量。团队影响由这支球队撰写的文件的引用量化。通过分析来自科学（例如计算机科学，物理学），社会科学（例如，社会学，图书馆和信息科学）和艺术和人文学科（例如，艺术）的770万队，我们发现平坦的团队结构与更高相关团队影响。当团队功率水平增加时，带有低团队电力层次的团队比高队电力层次结构的队伍更多。这些调查结果已经在所有五个学科中重复，除了艺术之外的所有五个学科，以及来自计算机科学的各种类型的团队，包括来自工业或学术界的团队，不同的性别团队的团队，具有地理对比的团队，以及具有独特统一的团队。

translated by 谷歌翻译

An Assessment Tool for Academic Research Managers in the Third World

Fernando Delbianco , Andres Fioriti , Fernando Tohmé

分类： (统计)机器学习

2022-09-07

研究人员出版记录的学术评估与确定有才华的晋升和资金候选人有关。这样做的关键工具是使用Web的科学和Scopus提供的索引，这些索引有时超出了世界许多地方的学术机构的可能性。我们在这里展示了一个基础之一中的数据如何用于推断另一个基础索引的主要索引。机器学习中使用的数据分析方法使我们只能选择数据库中数百个变量中的几个，后来在面板回归中使用，从而获得了与其他数据库中的主要索引的良好近似值。由于可以从网络上自由刮擦Scopus的信息，因此该方法可以自由推断出出版物的影响因素，这是全球研究评估中使用的主要索引。

translated by 谷歌翻译

A Review on Method Entities in the Academic Literature: Extraction, Evaluation, and Application

Yuzhuo Wang , Chengzhi Zhang , Kai Li

分类：自然语言处理

2022-09-08

在科学研究中，该方法是解决科学问题和关键研究对象的必不可少手段。随着科学的发展，正在提出，修改和使用许多科学方法。作者在抽象和身体文本中描述了该方法的详细信息，并且反映该方法名称的学术文献中的关键实体称为方法实体。在大量的学术文献中探索各种方法实体有助于学者了解现有方法，为研究任务选择适当的方法并提出新方法。此外，方法实体的演变可以揭示纪律的发展并促进知识发现。因此，本文对方法论和经验作品进行了系统的综述，重点是从全文学术文献中提取方法实体，并努力使用这些提取的方法实体来建立知识服务。首先提出了本综述涉及的关键概念的定义。基于这些定义，我们系统地审查了提取和评估方法实体的方法和指标，重点是每种方法的利弊。我们还调查了如何使用提取的方法实体来构建新应用程序。最后，讨论了现有作品的限制以及潜在的下一步。

translated by 谷歌翻译

Style, Content, and the Success of Ideas

Reihane Boghrati , Jonah Berger , Grant Packard

分类：自然语言处理

2022-01-10

为什么有些事情在想法的市场中取得成功？虽然一些人认为内容推动成功，但其他人建议展示风格，或者思想的方式，也起到了重要作用。为了提供严谨的风格的重要性，我们将其审视内容应该是至关重要的：学术研究。虽然科学家们经常看到作为一种无私的方式，但多种方法调查表明写作风格的影响。从内容中分离风格可能是易于使用某些语言的论文也可能写出某些主题。因此，我们专注于链接到风格的独特单词（即，诸如“的功能词，”，“和”开启“），这些单词完全没有内容。来自一系列学科的自然语言处理近30,000篇文章发现功能词解释了13-27％的语言对引用的影响。辅助分析探讨了特定类别的功能词语，以表达风格的重要事项，突出了写作简单，个人声音和时间视角的作用。实验进一步强调了风格的因果影响。结果表明如何提高通信的影响并突出自然语言处理的价值，以了解思想成功。

translated by 谷歌翻译

Fairness in Recommender Systems: Research Landscape and Future Directions

Yashar Deldjoo , Dietmar Jannach , Alejandro Bellogin , Alessandro Difonzo , Dario Zanzonelli

分类：人工智能

2022-05-23

Recommender systems can strongly influence which information we see online, e.g., on social media, and thus impact our beliefs, decisions, and actions. At the same time, these systems can create substantial business value for different stakeholders. Given the growing potential impact of such AI-based systems on individuals, organizations, and society, questions of fairness have gained increased attention in recent years. However, research on fairness in recommender systems is still a developing area. In this survey, we first review the fundamental concepts and notions of fairness that were put forward in the area in the recent past. Afterward, through a review of more than 150 scholarly publications, we present an overview of how research in this field is currently operationalized, e.g., in terms of general research methodology, fairness measures, and algorithmic approaches. Overall, our analysis of recent works points to specific research gaps. In particular, we find that in many research works in computer science, very abstract problem operationalizations are prevalent, and questions of the underlying normative claims and what represents a fair recommendation in the context of a given application are often not discussed in depth. These observations call for more interdisciplinary research to address fairness in recommendation in a more comprehensive and impactful manner.

translated by 谷歌翻译

Taking a Language Detour: How International Migrants Speaking a Minority Language Seek COVID-Related Information in Their Host Countries

Ge Gao , Jian Zheng , Eun Kyoung Choe , Naomi Yamashita

分类：自然语言处理

2022-09-07

在公共危机时期，寻求信息对于人们的自我保健和福祉至关重要。广泛的研究调查了经验理解和技术解决方案，以促进受影响地区的家庭公民寻求信息。但是，建立有限的知识是为了支持需要在其东道国发生危机的国际移民。当前的论文对居住在日本和美国（n = 14）的两名中国移民（n = 14）进行了访谈研究。参与者反思了他们在共同大流行期间寻求经验的信息。反思补充了两周的自我追踪，参与者保持了相关信息寻求实践的记录。我们的数据表明，参与者经常绕开语言绕道，或访问普通话资源以获取有关其东道国疫情爆发的信息。他们还进行了战略性利用普通话信息，以进行选择性阅读，交叉检查以及对日语或英语的共同信息的上下文化解释。尽管这种做法增强了参与者对共同相关信息收集和感官的有效性，但他们有时会通过有时认识的方式使人们处于不利地位。此外，参与者缺乏对审查以移民为导向的信息的认识或偏爱，尽管该信息可用，这些信息是由东道国公共当局发布的。在这些发现的基础上，我们讨论了改善国际移民在非本地语言和文化环境中寻求共同相关信息的解决方案。我们主张包容性危机基础设施，这些基础设施将吸引以当地语言流利程度，信息素养和利用公共服务的经验的不同水平的人们。

translated by 谷歌翻译

Journal Impact Factor and Peer Review Thoroughness and Helpfulness: A Supervised Machine Learning Study

Anna Severin , Michaela Strinzel , Matthias Egger , Tiago Barros , Alexander Sokolov , Julia Vilstrup Mouatt , Stefan Müller

分类：机器学习 | (统计)机器学习

2022-07-20

期刊影响因素（JIF）通常等同于期刊质量和提交给该期刊的论文的同行评审质量。我们通过分析提交给1,644家医学和生命科学期刊的10,000个同行评审报告，研究了同行评审与JIF的内容之间的关联。两名研究人员手工编码了2,000个句子的随机样本。然后，我们训练了机器学习模型，以将所有187,240个句子分类为贡献或不为内容类别做出贡献。我们研究了JIF DICILES定义的十组期刊与使用线性混合效应模型的同行评审的内容之间的关联，并调整了评论的长度。 JIF的范围为0.21至74.70。同行评审长度从最低（单词中位数185）增加到JIF组（387个单词）。分配给不同内容类别的句子的比例甚至在JIF组中也有很大变化。为了彻底，与最低的JIF组相比，关于“材料和方法”的句子在最高的JIF期刊中更为普遍（7.8个百分点； 95％CI 4.9至10.7％）。 “演示和报告”的趋势朝相反的方向发展，最高的JIF期刊对此类内容的重视程度较小（差异-8.9％； 95％CI -11.3至-6.5％）。为了有助于，对更高的JIF期刊的评论更少关注“建议和解决方案”，而提供的示例少于较低的影响因素期刊。对于其他内容类别而言，没有，或者只有很小的差异。总之，在讨论使用的方法时，在提出解决方案和提供示例方面，在讨论所使用的方法但较小的帮助时，较高的JIF期刊的同行评审往往更为透彻。差异是适度的，可变性很高，表明JIF是对单个手稿的同伴评论质量的不良预测指标。

translated by 谷歌翻译

Cross-Lingual Citations in English Papers: A Large-Scale Analysis of Prevalence, Usage, and Impact

Tarek Saier , Michael Färber , Tornike Tsereteli

分类：机器学习

2021-11-07

学术数据中的引文信息是进入刊物的重要洞察的重要来源和学术话语。引文分析结果和引用的机器学习的适用性严重取决于此类数据的完整性。现在学术数据的一个特定的缺点是非英语出版物通常不包括在数据集中，或者语言元数据不可用。因此，唯一研究了不同语言（交叉引用）的出版物之间的引文仅对非常有限的程度。在本文中，我们对基于超过100万英文论文的交叉引用分析，跨越三个科学学科，三十年的时间跨度。我们的调查涵盖了引用的语言和学科之间的差异，随着时间的推移，趋势以及交叉引用的使用特征以及影响。在我们的研究结果中，引文的增加率为中文所写的出版物，引用主要针对当地非英语语言，以及交叉和单声道引用之间的引文意图的一致性。为了促进进一步的研究，我们会公开收集的数据和源代码。

translated by 谷歌翻译

D3: A Massive Dataset of Scholarly Metadata for Analyzing the State of Computer Science Research

Jan Philip Wahle , Terry Ruas , Saif M. Mohammad , Bela Gipp

分类：自然语言处理

2022-04-28

DBLP是计算机科学科学文章的最大开放访问存储库，并提供与出版物，作者和场地相关的元数据。我们从DBLP中检索了超过600万个出版物，并从出版物文本中提取了相关的元数据（例如摘要，作者分支机构，引用），以创建DBLP Discovery Dataset（D3）。 D3可用于确定计算机科学研究的研究活动，生产力，偏见，可及性和影响的趋势。我们提出了针对计算机科学研究量（例如论文，作者，研究活动的数量），感兴趣主题和引文模式的初步分析。我们的发现表明，计算机科学是一个不断增长的研究领域（每年约15％），拥有一个积极的协作研究员社区。与前几十年相比，近年来的论文提供了更多的书目条目，但引用的平均数量仍在下降。调查论文的摘要表明，最近的主题趋势在D3中明显反映。最后，我们列出了D3和提出补充研究问题的进一步应用。 D3数据集，我们的发现和源代码可公开用于研究目的。

translated by 谷歌翻译

A survey on datasets for fairness-aware machine learning

Tai Le Quy , Arjun Roy , Vasileios Iosifidis , Eirini Ntoutsi

分类：机器学习

2021-10-01

由于决策越来越依赖机器学习和（大）数据，数据驱动AI系统的公平问题正在接受研究和行业的增加。已经提出了各种公平知识的机器学习解决方案，该解决方案提出了数据，学习算法和/或模型输出中的公平相关的干预措施。然而，提出新方法的重要组成部分正在经验上对其进行验证在代表现实和不同的设置的基准数据集上。因此，在本文中，我们概述了用于公平知识机器学习的真实数据集。我们专注于表格数据作为公平感知机器学习的最常见的数据表示。我们通过识别不同属性之间的关系，特别是w.r.t.来开始分析。受保护的属性和类属性，使用贝叶斯网络。为了更深入地了解数据集中的偏见和公平性，我们调查使用探索性分析的有趣关系。

translated by 谷歌翻译

Distinguishing Transformative from Incremental Clinical Evidence: A Classifier of Clinical Research using Textual features from Abstracts and Citing Sentences

Xuanyu Shi , Jian Du

分类：自然语言处理

2021-12-24

在临床研究和临床决策中，重要的是要知道学习是否发生或仅支持目前的特定疾病管理的护理标准。我们将这种变化定义为变换性和作为增量研究的支持。它通常需要大量的人类专业知识和时间来完成这些任务。教师意见为我们提供了一个关于研究挑战或仅确认建立研究的良好注释的语料库。在本研究中，提出了一种机器学习方法，以区分从增量临床证据的变化。摘要和2年窗口的文本被收集了培训临床研究的培训，由教师观察专家标记。我们通过随机林为分类器，达到0.755（0.705-0.875）的平均AUC的最佳性能，并引用句子作为该功能。结果表明，与抽象句不同，转型研究具有引用句子的典型语言模式。我们提供了一个有效的工具，用于识别这些临床证据挑战或仅确认临床医生和研究人员的索赔。

translated by 谷歌翻译

Characterizing Multi-Domain False News and Underlying User Effects on Chinese Weibo

Qiang Sheng , Juan Cao , H. Russell Bernard , Kai Shu , Jintao Li , Huan Liu

分类：自然语言处理

2022-05-06

在过去几年中，社交媒体上传播的错误消息激增，并导致了现实世界中的多种威胁。尽管有关于特定领域的虚假新闻（例如政治或医疗保健）的研究，但比较跨领域的虚假新闻几乎没有工作。在本文中，我们调查了2009年至2019年中国最大的Twitter式社交媒体平台的微博上的九个领域的虚假新闻。新收集的数据包含44,728个帖子，由40,215个用户发布，并重新发布了。 340万次。基于多域数据集的分布和传播，我们观察到，在诸如健康和医学之类的日常生活的领域中，虚假的消息比政治等其他领域的帖子更有效，但有效地传播的帖子较少，而政治虚假新闻具有最有效的扩散能力。关于微博上广泛散布的虚假新闻帖子与某些类型的用户（按性别，年龄等。此外，这些帖子都引起了重新播放的强烈情绪，并随着False-News启动器的积极参与而进一步扩散。我们的发现有可能在可疑新闻发现，真实性预测以及显示和解释中帮助设计错误的新闻检测系统。微博上的发现与现有作品的发现表明了细微的模式，这表明需要对来自不同平台，国家或语言的数据进行更多研究，以解决全球错误新闻。代码和新的匿名数据集可在https://github.com/ictmcg/characterizing-weibo-multi-domain-false-news上找到。

translated by 谷歌翻译

Quantifying Gender Biases Towards Politicians on Reddit

Sara Marjanovic , Karolina Stańczak , Isabelle Augenstein

分类：自然语言处理

2021-12-22

尽管试图提高政治性别平等，但全球努力仍在努力确保女性的同等代表。这很可能与对权威妇女的性别偏见有关。在这项工作中，我们介绍了在线政治讨论中出现的性别偏见的全面研究。为此，我们在有关男性和女性政客的对话中收集了1000万条有关Reddit的评论，这使得对自动性别偏见检测进行了详尽的研究。我们不仅讨论了厌恶女性的语言，还解决了其他偏见的表现，例如以看似积极的情绪和主导地位归因于女性政客或描述符归因的差异的形式的仁慈性别歧视。最后，我们对调查语言和语言外暗示的政客进行了多方面的性别偏见研究。我们评估了5种不同类型的性别偏见，评估社交媒体语言和话语中存在的覆盖范围，组合，名义，感性和词汇偏见。总体而言，我们发现，与以前的研究相反，覆盖范围和情感偏见表明对女性政客的公共兴趣平等。名义和词汇分析的结果并没有明显的敌对或仁慈的性别歧视，这表明这种兴趣不像男性政客那样专业或尊重。女性政客通常以其名字命名，并与他们的身体，衣服或家庭有关。这是一种与男性相似的治疗方法。在现在被禁止的极右翼子列表中，这种差异最大，尽管性别偏见的差异仍然出现在右和左倾的子列表中。我们将策划的数据集释放给公众以进行未来研究。

translated by 谷歌翻译

Data Representativeness in Accessibility Datasets: A Meta-Analysis

Rie Kamikubo , Lining Wang , Crystal Marte , Amnah Mahmood , Hernisa Kacorri

分类：人工智能

2022-07-16

随着数据驱动的系统越来越大规模部署，对历史上边缘化的群体的不公平和歧视结果引起了道德问题，这些群体在培训数据中的代表性不足。作为回应，围绕AI的公平和包容性的工作呼吁代表各个人口组的数据集。在本文中，我们对可访问性数据集中的年龄，性别和种族和种族的代表性进行了分析 - 数据集 - 来自拥有的数据集，这些数据集来自拥有的人。残疾和老年人 - 这可能在减轻包含AI注入的应用程序的偏见方面发挥重要作用。我们通过审查190个数据集的公开信息来检查由残疾人来源的数据集中的当前表示状态，我们称这些可访问性数据集为止。我们发现可访问性数据集代表不同的年龄，但具有性别和种族表示差距。此外，我们研究了人口统计学变量的敏感和复杂性质如何使分类变得困难和不一致（例如，性别，种族和种族），标记的来源通常未知。通过反思当前代表残疾数据贡献者的挑战和机会，我们希望我们的努力扩大了更多可能将边缘化社区纳入AI注入系统的可能性。

translated by 谷歌翻译