全量知识系统 之 “百度翻译”

不知道大家是否注意到,百度翻译在前几天更新了一个版本,页面也和之前的完全不同。下面是对“百度翻译”的这次升级,对比全量知识系统的 “ 翻译器”功能设计进行的一个全面分析和提炼,以期能在此基础上给出全量知识系统 的“翻译器”的设计。

介绍及对比

"百度翻译”

界面除了对话框之外,1)上面有一个语言选择框(两个下拉菜单)和一个 两种语料来源(或请求内容)的单选按钮。2) 上面的下一行是一个提示框。 3)界面右下角增加了一个按钮。其中2)和3)都会随请求内容的不同而不同。

升级后的百度翻译将翻译 从翻译词条(语料)的来源上分成两类:

  • “传统机器翻译-通用领域”(在对话输入框下面配有“实时翻译”按键)。点击后,提示框会出现“当前由传统机器翻译 ·通用领域模型为您翻译”的字样。还可以选择除“通用领域”以外的另外9个领域(目前依次为:学术论文、生物医药、信息技术、金融财经、新闻资讯、航空航天、机械制造、法律法规、人文社科)。现在看到的“实时翻译”按钮是灰的,不知是要付款还是还不支持(原因不详)。
  • “AI大模型翻译-基础版AI”(在对话输入框下面配有“AI翻译”按键)。点击后,提示框 会出现“当前由AI大模型翻译 · 基础版为您翻译”的字样。然后点击“AI翻译”,提示框会闪现“AI翻译工作中,会自动参考 术语库 和记忆库”并在翻译结果展示出来时变回之前的提示内容““当前由AI大模型翻译 · 基础版为您翻译”。

全量知识系统的翻译器

前面关于解析器有过一些讨论,但翻译器还没有提到过。下面将给出“翻译器”的设想。

和“解析器”一样,“翻译器”也会按照语言的使用者 区分为 自然语言、人工语言和形式语言的翻译器。其中,人工语言就是AI语言,“形式语言FL”指能由翻译机器自动翻译成“程序语言PL”的语言),自然语言是指不受控的自然语言(简称“自然语言NL”,相对于人工语言中 的“受控的自然语言CNL”而言的)。

在人工语言中(对应的翻译器是“AI翻译”)并存三种语言,分别是CNL(受控的或自治的自然语言)、SPL(范式化的或分治的程序语言)和LHL(法治的或整治的高阶逻辑语言)。

在知识系统中的翻译器有两层意思。

在知识系统中的“翻译”有两层意思。

一是普通意义上的“翻译”,其功能就和这里所说的“百度翻译”相似,它要做的是不同语言之间的翻译。只不过在全量知识系统中 ,由于“语言”被抽象化了--将语言分为自然语言、形式语言和人工语言三大类。所以,此时普通意义上的“翻译”功能就分别指三个语言域中的翻译:

  • 自然语言翻译 是指两个不同语种的自然语言之间(例如中文和英文)的对翻。它支持多对多,这种 条件数称为全量知识的 “随机数条件”,表示为[*]。;
  • 人工语言翻译是两个人工语言不同角色role之间的对换-互替换。它允许为空,这种条件数称为全量知识的“操作数条件数”, 表示为[?])。
  • 形式语言翻译 是 两种不同风格style的编程语言之间的对射 。均为一对一,这种条件数称为全量知识的“机器数条件”, 表示为[1])。

二是其它意义上的“翻译”。此外,还有两种翻译功能和两种翻译相关的功能。1是不同语言类型之间的转换。二是它们各自的元级 和元级之间的转换。三是和翻译转换有关的两个功能,1是不同语言模型级之间的映射mapping (语言模型级到元级)以及 二者到元元级设施的映射projection。  (待完善)

AI翻译

在前面说到的三种语言各自的翻译器中,人工语言的翻译器又称为“AI翻译器”。AI翻译器 对有着有限的固定状态且被称为“组态”的AI部分--一个移动机器人系统--的翻译器,相当于规划中的 固件智能,它代表知识的具体应用场景中的一个可直接使用的AI组件(形式表示为GUI上的“工具箱”),也是通常所说的移动机器人robot。在全量知识系统中,将机器人(AI)分成 公共的、特定领域的、和专属行业的 三类应用场景的 AI组件,所以AI翻译也有 三个版本:基础版、扩展版和增强版,三者分别关注 通用大模型、领域专业模型 和行业应用模型。

AI翻译三个版本的解释:(增强版和基础版 有待完善)

  • 增强版A(允许用户的DIY请求  增强版本-模块化补丁的查缺补漏:增强和演变 演进请求request-AI增强)- 基于大对象数字自动化的仿生模型 仿真-神经元计算数字的像素数据模型<请求request>
  • 扩展版E(支持客户的定制需求  扩展版本-雏形版本version的版本升级 扩展和实现  模板填空fill-模拟AI)-  基于大规模数值公理化的机械连杆  模拟-计算机类比模拟的 图形算法模型  :AI翻译     自动参考 术语库和记忆库  对照术语库给出主题词表的主题词翻译的句型句式模板 < 科技热词-主题词表   语言和技术> 对比记忆库中存储的把握了的已知概念<并发> 同义词库-叙词库  <填空fill>
  • 基础版B(承诺服务的标准指令 原始版本- 模型代generation的更新换代 基础和计划  场景连线-假设检验)- 基于大数据形式化的机器学习 虚拟-符号学 的 概率统计模型    AI大模型翻译 · 基础版<>标准字典库 语料库 <场景scene>

它们都基于模板,都应该支持模式匹配以及进行对象配对-速配。

三个模型的原型分别是现实模型、 因果关系模型和  机器学习模型,分属不同的学科:   神经科学(认知的计算机科学)、计算机科学和符号学(认知科学)。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-10 00:06:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-10 00:06:01       101 阅读
  3. 在Django里面运行非项目文件

    2024-03-10 00:06:01       82 阅读
  4. Python语言-面向对象

    2024-03-10 00:06:01       91 阅读

热门阅读

  1. Qt的定时器QTimer

    2024-03-10 00:06:01       41 阅读
  2. Qt | 停靠窗口QDockWidget

    2024-03-10 00:06:01       42 阅读
  3. QT学习笔记2--QT简述

    2024-03-10 00:06:01       50 阅读
  4. LeetCode 2710.移除字符串中的尾随零

    2024-03-10 00:06:01       40 阅读
  5. 力扣 239. 滑动窗口最大值

    2024-03-10 00:06:01       44 阅读
  6. P10095 [ROIR 2023 Day 1] 斐波那契乘积

    2024-03-10 00:06:01       67 阅读
  7. Druid数据库连接池配置

    2024-03-10 00:06:01       47 阅读
  8. 国内用ChatGPT可以吗

    2024-03-10 00:06:01       46 阅读
  9. Xargs命令详解: 构建和执行命令的必备工具

    2024-03-10 00:06:01       49 阅读
  10. 面试经典150题(101-104)

    2024-03-10 00:06:01       44 阅读
  11. 一个简单的HTML 个人网页

    2024-03-10 00:06:01       44 阅读
  12. 【记录31】elementUI el-tree 虚线、右键、拖拽

    2024-03-10 00:06:01       43 阅读