开放科学综述:2024 年 XNUMX 月

在本期中,我们刊登了一篇新闻报道, 威利特·波特,美国新英格兰大学法学讲师。转载自 谈话 通过 Creative Commons CC-BY-ND。

一家学术出版商在作者不知情的情况下与微软达成了一项人工智能数据协议

5 月,总部位于英国、市值数十亿美元的跨国公司 Informa 在一份声明中宣布 交易更新 该公司已与微软签署了一项协议,涉及“访问高级学习内容和数据,以及合作探索人工智能专家应用程序”。Informa 是 泰勒和弗朗西斯,该公司出版各种学术和技术书籍和期刊,因此所涉及的数据可能包括这些书籍和期刊的内容。

根据 七月发布的报告,内容作者似乎并未被询问或被告知有关该交易的情况。此外,他们表示,他们没有机会选择退出该交易,也不会从中获得任何收益。

学术界只是我们所谓的内容创造者中最新的一个群体,他们对自己的作品被生成人工智能模型所吸收感到愤怒,而生成人工智能模型目前正在竞相吸收人类文化的产品。 报纸视觉艺术家 和 记录标签 已经将人工智能公司告上法庭。

虽然目前还不清楚 Informa 将如何应对这些不满情绪,但这笔交易提醒作家们要注意他们签署的出版协议的合同条款。

Informa 交易的内容是什么?

Informa 的最新消息指出了微软交易的四个重点领域:

  • 提高 Informa 自身的生产力
  • 开发自动引用工具
  • 开发人工智能研究助理软件(可能像一个由 在线学术图书馆 JSTOR)
  • 授予微软数据访问权限以“帮助提高人工智能系统的相关性和性能”。

Informa 将获得超过 8 万英镑(15.5 万澳元)的初始数据使用费,随后三年将定期支付未指定金额的费用。

我们不知道微软计划如何利用其数据访问,但可能的情况是,学术书籍和文章的内容将被添加到类似 ChatGPT 的生成式 AI 模型的训练数据中。原则上,这应该会使 AI 系统的输出更加准确,尽管现有的 AI 模型受到了严厉批评,不仅仅是因为 复述训练数据 未经引用(可以看作是一种 抄袭),而且对于 捏造虚假信息 和 归因 将其提供给真实的来源。

不过,更新版本还表示“该协议保护知识产权,包括对逐字文本摘录的限制以及对详细引用参考的重要性的一致性”。

提到的“逐字文本摘录的限制”可能涉及 美国合理使用原则,允许使用受版权保护的材料。

目前,许多生成式人工智能公司 面临版权侵权诉讼 他们对训练数据的使用存在争议,而他们的辩护很可能依赖于声称合理使用。

“详细引用参考的重要性”可能与版权中的归属概念有关。这是一个 精神权利 版权归作者所有。该法规定,在复制作品时,应注明创作者,并注明作者。

学术出版通常是如何进行的?

大多数学者不会从其大部分学术出版物中获得报酬或任何利润。相反,撰写期刊和会议论文通常被视为全职终身职位工作范围的一部分。出版物可以建立学者的信誉并促进他们的研究。

基本流程通常是这样的:作者研究并撰写原创文章,然后将其提交给期刊出版商进行同行评审。大多数同行评审员和编辑委员会成员也不会因其工作而获得报酬。

事实上,一些期刊可能会要求作者支付“文章处理费”来支付编辑和其他费用。对于 开放访问 出版物。一般来说,出版物越有声望,收费就越高。

如果文章通过了同行评审,作者将被要求签署一份 出版协议条款可能涵盖后勤安排,例如文章的发布时间、格式(印刷、在线或两者兼有)以及版税的分配(如适用)。还将涉及文章的版权和所有权的安排。

作者通常还必须同意 专有权 交给出版商分发和出版文章。这可能意味着作者不能在其他地方发表文章,出版商也可能能够将文章转授权给第三方,例如人工智能公司。

有时出版商会要求作者通过永久协议将文章的版权转让给他们 版权转让协议.

本质上,这意味着作者将其作为作品版权持有者的所有著作权授予出版商。然后,出版商可以根据自己的意愿复制、传播、分发或授权他人使用该作品。

有可能只分配有限的权利,而不是所有的权利,这是作者应该考虑的。

内容挖掘

至关重要的是,作者必须了解许可和转让的含义,并在签订合同时仔细考虑他们同意的内容。鉴于最近的趋势 出版商与生成式人工智能公司达成协议另外,出版商的人工智能政策也应受到严格审查。

在美国,标准 内部AI系统内容使用的集体许可解决方案 已于近期发布,其中规定了版权持有者的权利和报酬。类似的人工智能系统内容使用许可证可能很快就会进入澳大利亚市场。

学术出版商和人工智能公司之间达成的协议类型引发了许多学者的更大担忧。我们是否希望学术研究被简化为 人工智能知识挖掘对于此类做法的伦理和道德问题,目前还没有明确的答案。

关于作者:

威利特·波特博士 是新英格兰大学阿米代尔分校法学院的讲师。作为一名自豪的新英格兰大学校友,她于 2022 年 2021 月获得法学博士学位后,于 2022 年成为全职工作人员。25 年之前,她在新英格兰大学法学院担任了 XNUMX 年的兼职学者,参与了超过 XNUMX 个法律部门。


开放科学中的大故事

CERN 提供其开放科学办公室的“操作方法”

CERN 的开放科学办公室由 Anne Gentil-Beccot 领导,提供有关开放获取出版、管理研究数据和开源软件的指导,以使科学研究更易于访问和高效。该办公室成立于 2023 年,提供资源、组织治理会议并规划未来培训课程,旨在支持 CERN 对开放科学的长期承诺。有关研究和学术界如何做出贡献和受益的更多详细信息,请查看 文章全文.

Meta 与研究人员合作研究青少年心理健康

Meta 宣布了一项新的试点计划,旨在为来自 开放科学中心 (COS)访问 Instagram 数据六个月。该计划旨在研究和分析社交媒体平台对青少年心理健康的影响。 库马尔·赫曼特,Candid.Technology 副主编 艾玛·罗斯 在 Verge 上探索该问题。

进一步阅读:国际科学理事会最近启动了一项针对年轻人心理健康的项目,这是与世界卫生组织签署的谅解备忘录的一部分 https://council.science/our-work/mental-wellbeing-young-people/

全球钻石开放获取联盟公告

教科文组织于10月XNUMX日举办了一场线上活动,介绍并正式宣布成立全球钻石开放获取联盟,强调其愿景、使命和目标,并让利益相关方共同努力推动钻石开放获取。

观看活动录像 这里。.

诚信岌岌可危:面对“发表或消亡在发展中国家和新兴经济体

“发表或消亡” 文化导致科学出版面临重大的道德挑战,尤其是在发展中经济体。诸如作者署名买卖、“论文工厂”泛滥以及滥用人工智能进行欺诈性研究等不道德行为正在破坏科学研究的完整性并扭曲学术指标。这项发表在《医学前沿》上的研究重点介绍了学术欺诈案例,尤其是在低收入国家,并建议对作者署名进行更严格的核实、对科学欺诈采取纪律措施以及制定促进研究透明度和问责制的政策。

结构基因组学联盟为从事早期药物发现的开放科学组织探索数据科学路线图。

起租日期 自然通讯, 该开放科学研究组织致力于讨论人工智能(AI)作为该领域主要加速器所能带来的机遇,认为强大的数据管理需要精确的本体和标准化的词汇,而跨实验室的集中式数据库架构有助于将数据集成到高价值数据集中。


开放科学活动和机会 


我们最喜爱的五本开放科学读物


免责声明

我们的客人提供的信息、意见和建议是个人贡献者的信息、意见和建议,不一定反映国际科学理事会的价值观和信念。


照片由 切特纳普 on Unsplash

跳到内容