大模型备案语料来源安全要求

大模型备案的语料来源安全要求,对服务提供者的要求如下。

a)语料来源管理方面:

1)面向特定语料来源进行采集前,应对该来源语料进行安全评估,语料内容中含违法不良信息超过5%的,不应采集该来源语料;

2)面向特定语料来源进行采集后,应对所采集的该来源语料进行核验,含违法不良信息情况超过5%的,不应使用该来源语料进行训练。

b)不同来源语料搭配方面:应提高语料来源的多样性,对每一种语言的语料,如中文、英文等,以及每一种类型的语料,如文本、图片、音频、视频等,均应有多个语料来源;如需使用境外语料,应合理搭配境内外来源语料。

c)语料来源可追溯方面:

1)使用开源语料时,应具有该语料来源的开源许可协议或相关授权文件;注1:对于汇聚了网络地址、数据链接等能够指向或生成其他数据的情况,如果需要使用这些被指向或生成的内容作为语料,应将其视同于自采语料。

2)使用自采语料时,应具有采集记录,不应采集他人已明确不可采集的语料;注2:自采语料包括自行生产的语料以及从互联网采集的语料。 注3:明确不可采集的语料,例如已通过robots协议或其他限制采集的技术手段明确表明不可采集的网页数据,或个人已拒绝授权采集的个人信息等。

3)使用商业语料时: —— 应有具备法律效力的交易合同、合作协议等; —— 交易方或合作方不能提供语料来源、质量、安全等方面的承诺以及相关证明材料时,不应使用该语料; —— 应对交易方或合作方所提供语料、承诺、材料进行审核。

4)将使用者输入信息当作语料时,应具有使用者授权记录。

d)按照我国网络安全相关法律法规及政策文件要求阻断的信息,不应作为语料。

私信我们,获得大模型备案与算法备案在线指导,助您快速通关,产品早日上线!

相关推荐

  1. 模型备案语料来源安全要求

    2024-06-08 17:22:04       11 阅读
  2. 安全模型安全综述

    2024-06-08 17:22:04       23 阅读
  3. 安全审查常见要求

    2024-06-08 17:22:04       37 阅读
  4. 语言模型-模型基础文献

    2024-06-08 17:22:04       35 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-08 17:22:04       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-08 17:22:04       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-08 17:22:04       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-08 17:22:04       20 阅读

热门阅读

  1. 标题:深入探索Linux中的`ausyscall`

    2024-06-08 17:22:04       9 阅读
  2. HTML基础知识点

    2024-06-08 17:22:04       8 阅读
  3. Linux常用命令

    2024-06-08 17:22:04       9 阅读
  4. 音视频视频点播

    2024-06-08 17:22:04       7 阅读
  5. LeetCode 550, 380, 234

    2024-06-08 17:22:04       11 阅读
  6. KafkaStream Local Store和Global Store区别和用法

    2024-06-08 17:22:04       8 阅读
  7. Docker大学生看了都会系列(七、Dokcerfile详解)

    2024-06-08 17:22:04       10 阅读
  8. Windows系统中配置 Redis 监听特定的 IP 地址

    2024-06-08 17:22:04       10 阅读
  9. Android adb pull base.apk 方法介绍

    2024-06-08 17:22:04       8 阅读
  10. 【VVC】类和编码树了解

    2024-06-08 17:22:04       6 阅读
  11. golang优雅代码【lock实现】

    2024-06-08 17:22:04       7 阅读
  12. 堆排序---C语言

    2024-06-08 17:22:04       10 阅读
  13. [AIGC] 自定义Spring Boot中BigDecimal的序列化方式

    2024-06-08 17:22:04       8 阅读