自然语言处理（NLP）——法国工程师IMT联盟期末考试题

1. 问题1

（法语）En langue arabe l'écrasante majorité des mots sont formés par des combinaisons de racines et de schèmes. Dans ce mécanisme...

（英语）In Arabic language the vast majority（十之八九） of words are build out of combinations组合 of roots（词根） and schemes (transfixes)构词模式（或称变形模式）. In this mechanism 在这一机制中...

（中文）阿拉伯语中绝大多数词汇是由词根和构词模式（或称变形模式）组成的。以下是四个选择题选项，询问词根和构词模式分别包含什么信息：

Veuillez choisir une réponse :

a. les racines relèvent plutôt de la morphologie et les schèmes de la syntaxe

roots contain rather morphological形态学 information and schemes (transfixes) syntactic句法 information词根更多包含形态学信息，构词模式包含句法信息

b. les racines relèvent plutôt de la morphologie et les schèmes de la sémantique

roots contain rather morphological information and schemes (transfixes) semantic语义 information词根更多包含形态学信息，构词模式包含语义信息

c. les racines relèvent plutôt de la syntaxe et les schèmes de la phonétique

roots contain rather syntactic information and schemes (transfixes) phonetic 语音 information词根更多包含句法信息，构词模式包含音韵信息

d. les racines relèvent plutôt de la sémantique et les schèmes de la morphologie

roots contain rather semantic语义 information and schemes (transfixes) morphological information形态学信息词根更多包含语义信息，构词模式包含形态学信息

正确答案是 d。在阿拉伯语中，词根通常由三个字母组成，负责携带基本的语义信息；而构词模式（变形模式）则通过不同的字母组合和字母在词根中的位置变化来表达不同的语法功能和词性变化，因此它与形态学相关。

2. 问题2

"Dire que f, g → h est une règle d'inférence signifie...

Saying that f, g → h is an inference rule推理规则 means...

规则 "如果 f, g 则 h" 意味着什么呢？

a. Si on peut déduire f et g des axiomes, alors on peut déduire h des axiomes

If we can deduce f and g from the axioms公理, then we can deduce h from the axioms如果我们可以从公理中推导出 f 和 g，那么我们也可以从公理中推导出 h。

b. Tout modèle de f ou de g est modèle de h

Every model of f or of g is a model of h任何 f 或 g 的模型也是 h 的模型。

c. Si h est fausse alors soit f soit g, ou les deux sont fausses

If h is false then either f or g or both of them are false如果 h 是假的，则 f 或 g 其中之一或两者都是假的。

d. Si f et g sont vraies, alors h est vraie

If f and g are true, then h is true"如果 f 和 g 都是真的，那么 h 也是真的。

正确答案是 B。这个推理规则表明，如果 f 和 g 都是真的，那么可以推断出 h 也是真的。这是逻辑推理中的一个基本规则，通常在形式逻辑系统中使用。

正确答案是 d。在逻辑中，推理规则 "如果 f, g，则 h" 表示如果 f 和 g 都为真（即它们是成立的前提），那么可以推断 h 也为真。这是蕴含的概念，也就是说，两个命题 f 和 g 的真实性联合起来蕴含了第三个命题 h 的真实性。这是逻辑推导中的一个基本规则，被称为蕴含引入或条件引入。

选项a表述的是如果能够从公理中推出 f 和 g，那么可以从公理中推出 h。这个陈述是正确的，但它更多描述的是公理系统内的推导关系，而不是推理规则本身的定义。

选项b表述的是 f 或 g 的每一个模型都是 h 的模型。这个陈述在逻辑上是不准确的，因为 f 和 g 为真并不意味着它们的任何一个模型（或实例）都会让 h 为真。

选项c表述的是如果 h 为假，则 f 或 g 或两者都为假。这实际上描述的是逆向情况，即反向的蕴含关系，而不是正向的蕴含引入规则。

选项d是最直接和准确的表述。它直接对应于逻辑中的条件语句，也就是说如果“如果 f 和 g”，则“那么 h”，这正是推理规则的定义。

3. 问题3

La vaste majorité des erreurs que font les Francophones sont des homophones de la graphie correcte. Imaginons que nous avons stanza/spaCy et un phonétiseur avec sortie IPA (un outil qui convertit les graphèmes en phonèmes), comment se servir de ces deux outils pour corriger la plupart de ces erreurs?

The vast majority of spelling errors speakers of French do are homophonic相同的 with the correct spelling. Imagine you have stanza/spaCy and a speech synthesizer with IPA output (a tool that converts转换 graphemes词素 into phonemes音素), how can I use these two tools to correct most of these errors?"

多数拼写错误与正确拼写的词在发音上是相同的（即，它们是同音异形词）。然后提出了一个假设情境：假如你有一个叫做stanza/spaCy的工具和一个输出国际音标（IPA）的语音合成器（即，一个将字母转换成音素的工具），如何利用这两个工具来纠正大部分这类错误？

答案1：你可以使用stanza/spaCy工具来分析文本，找出可能的拼写错误，然后使用语音合成器将这些疑似错误的词转换成IPA音标。由于同音异形词在发音上是相同的，你可以比较错误的词和正确的词在IPA上的发音是否一致。如果发音一致，这个工具可能就可以用来指出正确的拼写形式。这样就能辅助用户纠正这类基于发音的拼写错误。

答案2:假设有一个法语句子：“Il a manger une pome.”（他吃了一个苹果。）在这个例子中，存在一个拼写错误：“pome”应该是“pomme”。

使用stanza或spaCy进行分词和词性标注：这两个工具都能够将文本分解为单词，并为每个单词标注词性。这对于识别可能的同音异形词非常重要。
识别同音异形词：遍历文本，查找那些在发音上相同但拼写不同的词。可以通过比较它们的国际音标（IPA）来实现这一点。发现“pome”和“pomme”在发音上相同。
生成国际音标（IPA）：对于每个单词，使用stanza或spaCy输出的词性标注信息，结合字典，可以生成相应的国际音标。这可以通过查询语音合成器的API或内置的功能来完成。对于“pome”和“pomme”，生成它们的国际音标。
比较同音异形词的国际音标：将发音相同的同音异形词的国际音标进行比较，以确定它们是否是拼写错误。发现它们在国际音标上相同，暗示可能是同音异形词。
提出纠正建议：一旦发现同音异形词，并确定它们中的一个是错误的，可以生成纠正建议。这可能包括替换错误的拼写，提供更正的建议，或者标注可能存在错误的地方供用户检查。提出将“pome”更正为“pomme”的建议。

应用纠正建议：根据纠正建议，可以自动或手动地应用拼写纠正。这可能涉及替换错误的拼写，插入缺失的字母，删除多余的字母等。自动或手动地将“pome”更正为“pomm

4. 问题4

Pour effectuer une fouille de sentiment concernant un produit A dans un gros corpus...

To perform sentiment mining related to a product A in a big corpus...如何进行大规模语料库中的产品情感分析

a. on considère une fenêtre glissante autour du nom du produit

I consider a sliding window around the product name

a. 考虑在产品名称周围使用滑动窗口。

b. on considère les arbres syntaxiques par dépendances dont le nom du produit est tête

I consider dependency syntax trees with the product's name as head

b. 考虑使用依存句法树，其中产品名称是树的中心节点。

c. on considère les arbres syntaxiques par constituants où le nom du produit apparait dans un groupe nominal

I consider constituency syntax trees where the product's name appears in a noun phrase

c. 考虑使用成分句法树，其中产品名称出现在名词短语中。

d. on considère les arbres syntaxiques par dépendances dont le nom du produit est à distance 1 de la tête

consider dependency syntax trees where the product's name is at distance 1 from the head"

d. 考虑使用依存句法树，其中产品名称与中心节点的距离是1。

这些方法都是分析文本并从中提取与特定产品相关的情感态度的技术。选择合适的方法取决于具体分析的需求和语料库的特性。

选择哪个方法最合适取决于您想要的分析深度和精确度。通常：

a. 滑动窗口: 考虑在产品名称周围使用滑动窗口）可能对初步分析有用，因为它简单地集中在产品名称附近的文本上。这种方法会考虑产品名称周围的词汇，基于这个窗口内的词汇来确定情感。这种方法简单，但可能会错过语法结构更复杂的情感表达。

选项b（考虑使用依存句法树，其中产品名称是树的中心节点）对于理解句子中的依存关系很有用，这有助于更准确地确定情感是如何与产品名称关联的。

b. 依存句法树，产品名称为中心节点**: 依存句法树可以揭示词汇之间的关系，并以产品名称为中心构建语法结构。这种方法能够捕捉到直接与产品名称相关的情感，但可能会错过更远距离的相关情感表达。

选项c（考虑使用成分句法树，其中产品名称出现在名词短语中）可以帮助分析复杂的句子结构，更好地理解语境中的情感表达。c. **成分句法树，产品名称在名词短语中**: 成分句法树揭示了句子的层次结构，如果产品名称是名词短语的一部分，这个方法可以找到整个短语的情感色彩。这种方法适合捕捉紧密相关的情感表达。

选项d（考虑使用依存句法树，其中产品名称与中心节点的距离是1）可能有助于识别直接与产品名称相关的属性和情感。

依存句法树，产品名称与中心节点的距离为1: 这种方法类似于b，但它特别关注与产品名称最直接相关的词汇。这有助于确定最直接的情感关系，但可能会遗漏更复杂的语境。选择哪种方法取决于具体的语料库和情感分析的目标。如果情感通常在产品名称的直接附近表达，那么选项d可能是最好的。如果情感表达与产品名称的关系在语法上更为复杂，选项b和c可能更为合适。如果语料库中的情感表达通常很直接且不涉及复杂的句子结构，选项a可能足够且效率更高。

在没有更多信息的情况下，我倾向于推荐b或d，因为依存句法树通常更能准确捕捉到词与词之间的关系，从而可以更准确地提取情感表达。但最终的选择应该基于对语料库的详细分析和预期情感表达的复杂性。

5. 问题5

On me demande de traiter par des outils de TAL les deux phrases suivantes contenant des émojis : « Aujourd'hui il y a un [émoji soleil] magnifique » et « j'ai raté le train [émoji visage triste] ». Comme vais-je traiter les émojis dans les deux cas ?

I'm asked to process, using NLP tools, the following two sentences, containing emojis: "Today there is a bright [sun face emoji] in the sky" and "I just missed my train [sad face emoji]". How will a process the emojis in these two cases?

有人要求我使用自然语言处理（NLP）工具来处理以下两句包含表情符号的句子：“今天天空中有一个明亮的[太阳脸表情符号]”和“我刚刚错过了火车[悲伤脸表情符号]”。我应该如何处理这两种情况中的表情符号？

方法1:

对于这两句话中的表情符号处理，我们可以采用几种不同的方法：

将表情符号当作一个独立的符号或词汇进行处理，识别其情感倾向（如太阳脸表情符号通常表示积极正面，悲伤脸表情符号表示消极负面）。

在进行情感分析时，考虑表情符号对句子情感色彩的影响，将其作为情感强度的加权因素。

如果工具不支持直接处理表情符号，可以将表情符号替换为对应的文本描述（如将[太阳脸表情符号]替换为“阳光明媚”，将[悲伤脸表情符号]替换为“感到悲伤”），然后再进行分析。

使用支持表情符号的NLP工具库（如果存在的话），这些工具可以直接理解并处理表情符号。

在实际操作中，我们需要选择或开发支持表情符号分析的NLP工具，以便更准确地解读句子的情感含义。

方法2:

1. 文本处理： NLP工具首先会对文本进行标记化，将句子分解成单词或标记。这也包括对表情符号的处理，将它们看作是文本的一部分。

2. 情感分析：表情符号通常用于表达情感或情绪。在情感分析中，NLP工具会尝试识别表情符号与文本之间的情感关系。例如，一个笑脸可能表示正面情感，而一个哭脸可能表示负面情感。这有助于更全面地理解句子的情感倾向。

3. 含义解释：表情符号有各种各样的含义，而这些含义可能会因上下文而异。NLP工具需要考虑表情符号在句子中的位置以及与文本的关联，以更准确地理解其含义。

4. Emoji表情词典：一些NLP工具使用专门的Emoji表情词典，其中包含了各种表情符号的常见含义。这有助于工具更好地理解特定的表情符号，并将其与相关的情感或含义联系起来。

上下文分析：考虑表情符号与相邻文本之间的关系以及整个句子的上下文对于准确理解表情符号至关重要。某个表情符号在一个上下文中可能有不同的含义，因此需要全面考虑。

方法3：

文本清洗：将实际的表情符号转换为文本表示，例如将😊转换为<happy_face>，将😢转换为<sad_face>。

情感分析：利用情感分析库，如Python的TextBlob或VADER，来分析转换后的文本。这些库通常能够处理简单的文本表示的情感。

定制化处理：如果需要更细致地处理表情符号，可以构建一个包含表情符号及其情感倾向的映射表，以此来加强分析的准确性。

6. 问题6

Un mot donné peut avoir plusieurs significations et, de ce fait, appartenir à plusieurs synsets de WordNet. Comment associer une occurrence de ce mot à un synset donné?

A given word can have many meanings, and therefore belong to several WordNet synsets. Who can I map a word instance to a given synset?"

一个给定的词可以有多个意思，并因此属于WordNet中的多个同义词集。我怎样才能将一个词的出现映射到一个给定的同义词集上？”

要将一个词的特定实例映射到WordNet中的一个特定同义词集，可以采用以下步骤：

上下文分析：分析词在文本中的上下文。不同的上下文通常能够提供关于词意的线索。

词义消歧（Word Sense Disambiguation, WSD）：这是NLP中的一个常见任务，目的是确定在特定上下文中使用的词的确切含义。可以使用基于规则的方法、监督学习或者半监督学习方法来实现。

使用NLP工具：有些NLP工具和库（如NLTK）内置了词义消歧的功能，可以利用这些工具来自动进行词义消歧。

WordNet库：如果你在使用Python，可以使用NLTK库中的WordNet接口。可以编写一个算法，根据词在句子中的用法，查询WordNet以找到最匹配的同义词集。

在WordNet中，一个词可能具有多个义项（synsets），因此将一个词的具体出现与特定的义项关联起来可能涉及以下几个步骤：

1. 上下文分析：分析句子或段落中的上下文，以了解特定词语在给定语境下的含义。通过考虑词语周围的其他词汇和句子结构，可以更准确地确定词语的语义。

2. 语义标注：使用自然语言处理（NLP）工具进行语义标注，以识别文本中单词的具体含义。这些工具可能会利用上下文信息、词汇语境和统计学习方法来确定词语的语义。

3. 使用词义消歧算法：词义消歧是一种通过上下文信息选择一个词语义的方法。这种方法可以根据上下文对多个义项进行排名，选择最有可能的含义。

4. 基于词汇数据库：利用WordNet等词汇数据库，这些数据库提供了词语的不同义项。根据上下文信息，从词汇数据库中选择最合适的义项。

例如，如果我们有一个法语词汇 "banque"，它可能有多个义项，比如可以是"financial institution"（金融机构）或"side of a river"（河的一边）。通过分析上下文，使用NLP工具或词义消歧算法，可以决定在特定语境下 "banque" 是指金融机构还是河的一边。

总体来说，将一个词语的具体出现与特定义项关联起来需要考虑上下文、语义标注、词义消歧等多个因素，这些方法可以帮助确定在给定语境中词语的确切含义。

7. 问题7

Quand on dit que le français a 36 phonèmes, cela veut dire que...

When we say that French language has 36 phonemes, this means that...

当我们说法语有36个音素时，这意味着…

a. pour parler parfaitement et sans accent le français il suffit d'apprendre 36 phonemes

to speak French perfectly and without any accent, you just need to learn 36 phonemes

为了流利且无口音地说36个音素类

b. un sous-ensemble fixe de 36 signes de l'alphabet phonétique international suffit pour transcrire tout mot français

a subset of 36 signs of the international phonetic alphabet字母表 is sufficient to phonetically represent every French word

国际音标的36个符号足以音译每个法语单词

c. la méthode des paires distinctives fournit 36 classes de phones

the minimal pairs method provides 36 phone classes

独特配对法提供 36 个电话类别

d. qu'en ajoutant dix lettres à l'alphabet français on ne ferait plus aucune faute d'orthographe

by adding 10 letters to the French alphabet (which already has 26 letters) we would never do any spelling error anymore

如果法语字母表再增加十个字母（已经有26个字母了），我们就不会再有任何拼写错误

正确答案是 b。这是因为音素是语言中最小的音位单位，可以区分意义，而国际音标（IPA）是一个能够准确表示世界上任何语言发音的系统。如果法语有36个音素，这意味着只需要国际音标中的36个符号就能够表示法语中的所有音素，从而能够准确地音译每个法语单词。其他选项要么与音素的定义不符（a和c），要么与原问题的语言学内容不相关（d）。法语，你只需要学习36个音素

8. 问题8

Contrairement aux langages formels de Chomsky, un langage visuel...

Contrarily to Chomsky's formal languages, a visual language...

与乔姆斯基的形式语言不同，视觉语言...

a. peut utiliser plusieurs opérateurs de concaténation

can use many concatenation operators

可以使用多个串联运算符

b. associe une probabilité à chaque règle de production

attaches a probability value to each production rule

为每个产生规则关联一个概率值

c. utilise des images à la place des lettres (formelles)

uses images instead of (formal) letters

使用图像代替（形式）字母

d. possède des sous-langages définis comme composantes connexes du graphe des productions

has sublanguages corresponding to connected components of the graph of productions"

拥有定义为产生图的连通分量的子语言

正确答案是 c。视觉语言与乔姆斯基的形式语言不同，它使用图像来代替字母或符号。形式语言通常是由字母构成的字符串，而视觉语言则利用图像来表达和传递信息。其他的选项a、b和d描述的是形式语言可能具备的特征，并不特指视觉语言的特性。

9. 问题9

La formule (A(X,Y)=X) ∧ A(X,Y) est...

The formula (A(X,Y)=X) ∧ A(X,Y) is...

公式 (A(X,Y)=X) ∧ A(X,Y) 是...

a. satisfaisable

satisfiable

a. 可满足的

b. de forme normale conjonctive

in conjunctive normal form

b. 是合取范式

c. vraie quand le domaine n'a qu'un seul élément

true when the domain is a singleton

c. 当域只有一个元素时为真

d. syntaxiquement incorrecte

syntactically invalid

d. 语法上不正确

如果要选择最符合逻辑的答案：

公式 $(A(X,Y)=X) \land A(X,Y)$ 表示两个条件都必须同时满足：

1. $A(X,Y) = X$ ：这意味着某个二元函数或关系A应用于一对元素X和Y时，返回的结果等于第一个元素X。

2. $A(X,Y)$ ：这通常表示函数或关系A应用于X和Y是真实或有效的，但是在这里可能存在一个逻辑上的歧义，因为 $A(X,Y)$ 被用作了一个表达式（在 $A(X,Y) = X$ 中）和一个命题（在 $\land A(X,Y)$ 中）。正常情况下，逻辑命题不能同时也是个表达式。

在形式逻辑中，当我们谈论关系或函数A时，我们通常指的是某种从一对元素到一个真值的映射，例如，它可能代表“X能否控制Y”或“X与Y是关联的”。但在这个特定的表述中，我们需要更多的上下文来准确理解 $A(X,Y)$ 的意义，特别是它如何同时作为等式的一部分和一个单独的命题存在。

如果我们假设A是一个能返回元素本身的函数，那么 $(A(X,Y)=X)$ 是有意义的。但 $A(X,Y)$ 立即跟在 $\land$ 后面没有进一步的说明（比如 $A(X,Y)$ 是真还是假），所以它在语法上看似不完整，可能就是为什么有一个选项是 "syntaxiquement incorrecte"（语法上不正确）。然而，如果我们认为 $A(X,Y)$ 是一个命题函数，它表达X和Y的某种关系，并且在X和Y满足该关系时为真，那么这个表达式在形式逻辑中是有意义的。

这个表达式是否有语法错误，或者它是否可满足，或者是否在域是单元素集时为真，取决于A的具体定义和上下文。在缺乏这些信息的情况下，我们不能确定它是否语法上不正确，也不能确定它是否在某种逻辑系统中可满足或有其他特定的真值性质。

选项d说这个公式“语法上不正确”（syntactically invalid），这在数理逻辑或者计算机科学中的形式语言中是指不遵循预定的语法规则，导致表达式无法正确地被解析或理解。在这个公式 (A(X,Y)=X) ∧ A(X,Y) 中，第一部分 (A(X,Y)=X) 是一个谓词，表示对于所有的X和Y，函数A的结果是X，这在逻辑上是有意义的。第二部分 A(X,Y) 看起来是在说函数A应用于X和Y。如果A是谓词，那么A(X,Y) 不能等于X，因为谓词的结果是布尔值（真或假），而不是元素本身。所以在某些语法系统中，这个表达式可能被认为是语法上不正确的。然而，如果A(X,Y)是指函数A应用于X和Y的结果，那么它就应该是一个元素，而不是一个布尔值，这使得等式A(X,Y)=X在语义上才有可能是正确的。

因此，通常来说，如果我们在传统的逻辑系统中解读这个表达式，它的确可能被认为是“语法上不正确”的，特别是如果我们假设A(X,Y)是一个布尔值。然而，这取决于我们对于函数A的解释以及我们所使用的语法规则。如果你有更具体的上下文或者这个公式是从某个具体的理论或系统中来的，请提供更多信息，以便于做出更准确的判断。在没有更多信息的情况下，答案d可能是正确的。

10. 问题10

J'écris dans un fichier de texte brut codé en Unicode une phrase en français suivie d'une phrase en arabe. Supposons qu'il n'y ait pas de signe de ponctuation à la fin des phrases française et arabe. Dans la mémoire de la machine :

I'm writing in a Unicode-encoded raw text file a sentence in French followed by a sentence in Arabic. Let us assume there is no punctuation mark at the ends of these sentences. In machine memory:

我在一个Unicode编码的原始文本文件中写一句法语，接着是一句阿拉伯语。

假设这些句子的末尾没有标点符号。在计算机内存中：

a. la première lettre arabe suit immédiatement la dernière lettre française

the first Arabic letter follows immediately the last French letter

第一个阿拉伯字母紧跟在最后一个法语字母之后

b. la dernière lettre française suit immédiatement la dernière lettre arabe

the last French letter follows immediately the last Arabic letter

最后一个法语字母紧跟在最后一个阿拉伯字母之后

c. la dernière lettre arabe suit immédiatement la dernière lettre française

the last Arabic letter follows immediately the last French letter

最后一个阿拉伯字母紧跟在最后一个法语字母之后

d. la première lettre française suit immédiatement la dernière lettre arabe

the first French letter follows immediately the last Arabic letter"

第一个法语字母紧跟在第一个阿拉伯字母之后

正确答案是 a。因为Unicode文本文件中的文本是按照它们出现的顺序存储的，而且考虑到法语是从左到右书写，阿拉伯语是从右到左书写，答案不是b因为b的说法是最后一个法语字母跟在最后一个阿拉伯字母后面。这意味着在写入序列中，阿拉伯语的最后一个字母（实际上在视觉上是阅读顺序中的第一个字母）会在法语的最后一个字母之前，这是不正确的。

根据我们刚才的例子：

- 法语句子是“Bonjour”。

- 阿拉伯语句子是“مرحبا”。

在计算机内存中无标点的情况下连续写入，会呈现为：

在这个字符串中，“r”是法语句子的最后一个字母，而“ا”（alif）是阿拉伯语句子的第一个字母（尽管在从右到左的阿拉伯语中它是视觉上的最后一个字母）。在这个串联的字符串中，“r”（法语句子的最后一个字母）紧接着“ا”（阿拉伯语句子的第一个字母），而不是反过来，这就是为什么b不正确。正确的答案是a，它正确描述了在计算机内存中这两个字母的顺序。

11. 问题11

Combien de morphèmes y a-t-il dans le mot transportables ? Sont-ils liés ou libres ?

How many morphemes are there in the (French) word transportables? Are they bound or free?"

法语单词 transportables 中有多少个词素？它们是连缀的还是自由的？

答案：

1. "trans-" 是一个前缀，通常表达“超越”或“穿过”的意义，它是一个连缀的词素。

2. "port" 是词根，表示“携带”或“运输”，它是一个自由词素。

3. "-able" 是一个后缀，通常用来形成形容词，意思是“能够被...的”，是连缀的词素。

4. "-s" 表示复数，也是一个连缀的词素。

所以，“transportables”总共有四个词素，其中“port”是自由词素，其他的“trans-”、“-able”和“-s”是连缀词素。

相连的词素（Bound Morphemes）：这些词素不能独立形成完整的单词，它们通常需要与其他词素结合才能具有独立的含义。例如，英语中的前缀（如"un-"）和后缀（如"-ed"）就是相连的词素。它们在单词中是附属的部分，无法独立存在。

例子：un + happy = unhappy，表示“不快乐”。

自由的词素（Free Morphemes）：这些词素可以独立存在，构成完整的单词，而不需要与其他词素结合。词干（stem）通常是自由的词素，因为它们可以独立构成有意义的词汇。

例子：play 是一个自由的词素，构成单词 play，表示“玩”。

12. 问题12

In description logics is there a relation between the sets ∃f.A and ∀f.A?

在描述逻辑中，集合 ∃f.A 和 ∀f.A 之间有关系吗？

a. Oui, ∃f.A ∪ ∀f.A = T

Yes, ∃f.A ∪ ∀f.A = T

是的，存在性量词 f.A 与全称量词 f.A 的并集等于 T（真集合）

b. Oui, ∃f.A ∩ ∀f.A = ⊥

Yes, ∃f.A ∩ ∀f.A = ⊥

是的，存在性量词 f.A 与全称量词 f.A 的交集等于 ⊥（假集合）

c. Oui, ∃f.A ⊂ ∀f.A

Yes, ∃f.A ⊂ ∀f.A

是的，存在性量词 f.A 是全称量词 f.A 的子集

d. Non

No"

不是

在描述逻辑中，∃f.A 表示“存在一个A，使得f适用”，而 ∀f.A 表示“对所有A，f都适用”。这两个集合之间通常没有简单的集合论关系，因为它们表达的是不同的概念：一个是存在性声明（至少有一个），另一个是普遍性声明（所有）。然而，在某些情况下，存在性量词的集合可以是全称量词集合的子集，但这取决于f和A的特定性质。

这个问题的标准答案通常是d. 否，因为这两个集合通常不被认为有必然的包含或相等关系。然而，这个问题可能在某些特定的逻辑框架或解释下有不同的答案，比如在某些情况下可以证明存在性量词的集合确实是全称量词集合的子集。但在没有进一步信息的情况下，最安全的答案是d. 否。

如果答案是 c，即 ∃f.A ⊂ ∀f.A，这在描述逻辑的某些情况下是成立的。具体来说，这个关系表明：

对于集合 ∃f.A，存在至少一个元素x，使得f(x)是A的一个实例。

对于集合 ∀f.A，所有元素x满足f(x)都是A的实例。

如果我们接受∀f.A的定义意味着在所有可能的情况下f(x)都属于A，那么任何属于∃f.A的元素（至少有一个满足条件的元素）自然也会属于∀f.A（所有满足条件的元素），这符合子集的定义。换句话说，如果存在至少一个满足条件的实例，那么肯定所有满足条件的实例都包含了那至少一个实例，因此存在性量词的集合是全称量词集合的子集。这种情况下，∃f.A ⊂ ∀f.A 是描述逻辑中特定情境下的正确关系。

13. 问题13

Si la sémantique formelle de Montague devient vite très complexe et plante à chaque fois qu'on s'écarte de la syntaxe standard, à quoi sert-elle aujourd'hui ?

If Montague formal semantics is a method that becomes rapidly extremely complex and that breaks every time one uses even slightly nonstandard syntax, what is it good for today?

如果蒙太古形式语义学一旦偏离标准语法就变得非常复杂，并且每次使用即使是略微非标准的语法就会出错，那么它今天有什么用呢？

a. elle sert à analyser en profondeur des productions en langage contrôlé

it is good for deep analysis of controlled natural language utterances

它适用于深入分析控制自然语言的表达

它适用于对受控自然语言言语进行深入分析

b. si ça marche pour une phrase sur deux, c'est déjà bien

if it manages to parse every second sentence or so, that’s pretty good already

如果它能解析一半的句子，那已经很不错了

如果它能够解析大约每两个句子中的一个，那已经相当不错了

c. elle sert à analyser les phrases correctes, les autres n'ont qu'à être réécrites

it is good for parsing correct sentences, the other ones need only to be rewritten

它适用于解析正确的句子，其他句子只需重写

它适用于解析正确的句子，其他的句子只需要被重写

d. à rien, de toute façon aujourd'hui on a des réseaux de neurones qui peuvent tout faire

you bet it's no good, we now have neural networks that can do everything!"

没什么用，反正现在我们有神经网络可以做任何事

你可以打赌它没什么用，因为现在我们有神经网络可以做所有事情！

蒙太古形式语义学（Montague Grammar）是一种将自然语言句子映射到形式逻辑表达式的方法。虽然当面对非标准或复杂语句时，这个方法可能会变得复杂和脆弱，但它在分析形式化、结构良好或受控制的自然语言语境中仍然非常有价值。例如，它可以应用于需求明确、严格定义的域，如法律文件、技术文档等领域的语言分析。

答案是 a：它适用于深入分析控制自然语言的表达。这表明即使存在现代的替代方法，如神经网络，蒙太古语义学在某些应用场景下依然是有其独特价值和用途的。

14 问题14

Parmi les tâches suivantes dans quel cas j'aurais le plus intérêt à utiliser des arbres de dépendances :

Among the following tasks, for which one will I rather use dependency trees rather than some other method:

在以下任务中，我最有可能更倾向于使用依存树而不是其他方法的是：

a. pour une détection de langue

language detection

a. 用于语言检测

b. pour une fouille de sentiment

sentiment mining

b. 用于情感挖掘

c. pour une classification supervisée par thèmes

supervised classification by themes

c. 用于主题的监督分类

d. pour une traduction automatique

automatic translation

d. 用于自动翻译

依存树（dependency trees）在情感分析（sentiment mining）任务中尤其有用，因为它们能够帮助揭示句子中单词之间的关系，这对于理解句子的情感倾向是很重要的。依存树提供了一个明确的结构，表明了句子中的主语、宾语和其他元素如何相互关联，这对于确定情感表达非常有帮助。所以，正确答案是：b. 用于情感挖掘

15. 问题15

Une description intensionnelle de langage, c'est quand...

We have an intensional description of a language when...

当我们有一种语言的内涵描述时，这是指...

a. le langage est décrit par les propriétés que ses membres doivent avoir

the language is described by the properties its members must have

语言由其成员必须具有的属性来描述

b.l'auteur du langage est mû d'une bonne intention

the author of the language is acts with good intentions

语言的作者有着好意图

c. le langage est décrit par une suite de mots qui permet d'inférer tous les autres mots

the language is described by a sequence of words sufficiently long to allow infer all other words

语言通过一系列足够长的词描述，从而能推断出所有其他词

d. le langage est décrit par des formules logiques

the language is described by logical formulas

语言由逻辑公式来描述

内涵描述是指通过指定对象必须满足的属性来描述一组对象，而不是通过列出所有的对象。这是与外延描述相对的，后者是直接列举出所有对象。

a. 语言由其成员必须具有的属性来描述。这是因为内涵描述侧重于对象的属性和特征，而不是对象的具体枚举。

16. 问题16

Imaginons une langue tellement parfaite que dans son WordNet il n'existe qu'un seul synset pour chaque mot et imaginons que j'enlève de ce WordNet toutes les gloses. Est-ce que a ressource restante après cette opération serait d'une utilité quelconque, et pourquoi ?

Let us imagine a language that is so perfect that its WordNet has only a single synset for each word. And let us consider I remove all glosses from its WordNet. Is the resource I get by doing this of any use, and why?"

假设有一种语言非常完美，在它的WordNet中每个词只有一个义元集，然后假设我从这个WordNet中移除所有的词义解释。在这个操作之后剩下的资源会有任何用处吗，为什么？

如果我们移除了WordNet中所有单词的词义解释（glosses），剩下的将只是词汇和它们的关系（义元集）。虽然这会失去直接的定义，但这样的资源依旧保留了词汇之间的网络结构，例如它们之间的同义词和反义词关系。这种结构信息对于语义分析、自然语言处理任务、语言学习等方面可能仍然有一定的用处，因为它揭示了语言中词汇的组织方式。然而，没有了具体的词义解释，这个资源的实用性大大减少了，因为用户或计算机系统无法直接通过它来了解每个词汇的具体含义。

即使从WordNet中移除了所有词义解释（glosses），剩下的结构——也就是单词之间的关系和义元集——仍然有几个具体的用途：

1. 语义相似度计算：剩下的义元集之间的关系可以用来计算词汇之间的语义相似度，这在许多自然语言处理任务中非常有用，比如信息检索、文本分类或推荐系统。

2. 自动词义消歧WSD，代表 Word Sense Disambiguation：通过分析词汇之间的网络关系，可以帮助自动确定词汇在特定上下文中的意义，即使没有直接的词义解释。

3. 语言教学和学习：学习者可以通过探索单词之间的关系来理解词汇在语言中是如何互相关联的，这对于掌握词汇的深层含义很有帮助。

4. 机器学习和数据挖掘：在机器学习模型中，WordNet的这种结构可以作为特征输入，帮助模型理解和处理自然语言。

5. 词汇网络分析：语言学家和研究者可以使用这个结构来研究语言使用的模式和词汇的组织方式。

然而，没有词义解释，这些用途都会受到限制，因为理解和解释词汇的具体含义变得更加困难。这可能会导致一些应用的精度下降，比如那些依赖于精确词义来进行精细加工的任务。

17 问题17

Pourquoi en français (au mode déclaratif) toutes les phrases sont SVO alors qu'en allemand on peut écrire indifféremment des phrases SVO et OVS ?

Why are all (declarative) French sentences SVO while in German one can write equally well SVO and OVS sentences?"

为什么在法语中（陈述句模式）所有句子都是SVO，而在德语中，我们可以随意写SVO和OVS句子？

在法语中，句子的典型结构是主语-谓语-宾语（SVO）。这种语序在法语中是固定的，尤其是在陈述句中，很少有变化，因为它是一种语法规则，这意味着句子的元素必须以特定的顺序排列。

相比之下，德语是一种屈折语言，它的语法结构允许更多的灵活性。在德语中，通过案例标记（nominative for the subject, accusative for the direct object, etc.）来识别句子成分的功能，这使得词序可以更加灵活。例如，虽然标准的陈述句语序是SVO，但是OVS结构在诗歌、强调某个特定对象时或者文学作品中也很常见。这种灵活性在句子中创建了强调和节奏的变化，这是德语词序的特点之一。

所以，法语中所有句子都是SVO的原因是因为它有严格的语法规则限制词序，而德语则因为其语法结构的灵活性，允许多种不同的词序。

18 问题18

The original text in the image is a multiple-choice question in French about formal grammar rules in computer science. It asks:

"Si A est un symbole non-terminal d'une grammaire formelle, est-ce qu'il est possible d'avoir une règle de production A → λ?"

"如果A是一个形式文法中的非终结符号，那么有可能有一个产生规则 A → λ 吗？"

a. 可以，但是从文法中移除它不会改变生成的语言

b. 可以，但前提是我们永远不使用它

c. 不可以，因为这将导致无限长度的派生

d. 不可以，因为那样A将同时是终结符和非终结符

a. Oui, mais l'enlever de la grammaire ne changerait pas le langage généré

Yes, but removing it from the grammar would not change the language generated

b. Oui, mais à condition de ne jamais l'utiliser

Yes, but only if we never use it

c. Non, car cela résulterait en des dérivations de longueur infinie

No, then we would have infinite-length derivations

d. Non, car alors A serait terminal et non-terminal en même temps

No, because then A would be final and intermediate at the same time

正确答案是 a。在形式文法中，非终结符号产生空字符串（表示为 λ）的规则是允许的。这样的规则通常被用来表示在某些构造中某些元素是可选的。如果从文法中移除这样的规则，且在移除之前这条规则从未被实际用于派生过程中，则它不会影响该文法生成的语言。因此，虽然在理论上非终结符号A可以产生空字符串，但在实际使用中，如果我们不使用这条规则，它就不会影响语言的生成。

19 问题19

La résolution d'anaphore consiste à...

Anaphora resolution consists in...

指代消解（anaphora resolution）包括什么？

a. calculer la termitude d'un syntagme

calculating termhood of a syntagm

a. 计算一个词组的术语属性

b. identifier le référent d'un groupe nominal

identifying the referent of a noun phrase

b. 确定一个名词短语的指称

c. remplacer un pronom par son référent

replacing a pronoun by its referent c

用指称替换一个代词

d. détecter les entités nommées

detecting names entities

d. 检测命名实体

正确答案是 b。指代消解指的是确定文本中的代词或指示词（如“他”，“它”，“这个”等）所指的具体对象。这通常涉及到识别一个名词短语和它所指的实体（可以是人名、地点、其他名词等）之间的关联。因此，这个过程涉及到识别出现在句子中的名词短语的确切指称。

20 问题20

the question asking for the correct first-order logic (FOL) formalization of the sentence "all red cars are expensive except one, called C.” The responses provided are logical expressions in FOL. Here are the choices :

a. ∀X ((X≠C ∧ (Voiture(X) ∧ Rouge(X)) → Chère(X))) ∨ (X=C ∧ Rouge(X) ∧ Voiture(X) ∧ ¬Chère(X))

b. ∀X ((X=C ∧ (Voiture(X) ∧ Rouge(X)) → ¬Chère(X))) ∨ (X≠C ∧ Rouge(X) ∧ Voiture(X) → Chère(X))

c. ∀X ((X≠C ∧ (Voiture(X) ∧ Rouge(X)) → ¬Chère(X))) ∧ (X=C ∧ Rouge(X) ∧ Voiture(X) → Chère(X))

d. ∀X ((X≠C ∧ (Voiture(X) ∧ Rouge(X)) → Chère(X))) ∨ (X=C ∧ Rouge(X) ∧ Voiture(X) ∧ ¬Chère(X))

Based on the logic required to express the given sentence, the correct formalization is option d, which correctly represents the statement that every red car is expensive, with the exception of the car named C, which is not expensive.

在图片中的题目是关于将自然语言句子转换成一阶逻辑（First Order Logic，FOL）的表达式。题目是：

“所有红色的汽车都很贵，除了一辆，叫做C。”

提供的答案选项为以下的逻辑表达式：

a. ∀X ((X≠C ∧ (Voiture(X) ∧ Rouge(X)) → Chère(X))) ∨ (X=C ∧ Rouge(X) ∧ Voiture(X) ∧ ¬Chère(X))

b. ∀X ((X=C ∧ (Voiture(X) ∧ Rouge(X)) → ¬Chère(X))) ∨ (X≠C ∧ Rouge(X) ∧ Voiture(X) → Chère(X))

c. ∀X ((X≠C ∧ (Voiture(X) ∧ Rouge(X)) → ¬Chère(X))) ∧ (X=C ∧ Rouge(X) ∧ Voiture(X) → Chère(X))

d. ∀X ((X≠C ∧ (Voiture(X) ∧ Rouge(X)) → Chère(X))) ∨ (X=C ∧ Rouge(X) ∧ Voiture(X) ∧ ¬Chère(X))

对应的中文翻译和逻辑表达式解释如下：

a. 对于所有的X：如果X不是C且X是一辆红色汽车，则X是昂贵的；或者如果X是C且X是一辆红色汽车，则X不是昂贵的。

b. 对于所有的X：如果X是C且X是一辆红色汽车，则X不是昂贵的；或者如果X不是C且X是一辆红色汽车，则X是昂贵的。

c. 对于所有的X：如果X不是C且X是一辆红色汽车，则X不是昂贵的；并且如果X是C且X是一辆红色汽车，则X是昂贵的。

d. 对于所有的X：如果X不是C且X是一辆红色汽车，则X是昂贵的；或者如果X是C且X是一辆红色汽车，则X不是昂贵的。

正确的逻辑表达式是d。它正确地表示了所有的红色汽车都是昂贵的，但有一个例外，即名为C的汽车不是昂贵的。这个表达式用以下的一阶逻辑形式来表达：

∀X ((X≠C ∧ (Voiture(X) ∧ Rouge(X)) → Chère(X))) ∨ (X=C ∧ Rouge(X) ∧ Voiture(X) ∧ ¬Chère(X))

这个逻辑表达式意味着对于任意对象X，如果X是除C以外的任何红色汽车，那么X是昂贵的；但如果X是C这一辆红色汽车，那么它不昂贵。

在一阶逻辑中，符号“∧”和“→”分别表示逻辑与（AND）和逻辑蕴含（IMPLIES）。

“∧”表示逻辑与操作，它要求两边的命题都为真，整个表达式才为真。比如，P ∧ Q是真的当且仅当 P 为真且 Q 也为真。

“→”表示逻辑蕴含操作，它的真值表是这样的：如果前提（左边的命题）为真，那么结论（右边的命题）也必须为真，整个蕴含式才为真。如果前提为假，无论结论是否为真，蕴含式都为真。即 P → Q是真的，除了当 P 为真而 Q 为假的情况。

在表达式 A ∧ ¬B 中，这意味着 A 必须为真且 B 必须为假，整个表达式才为真。

而在表达式 A → B中，如果 A 为真，那么 B 也必须为真；但如果 A 为假，那么无论 B 是真是假，A → B都为真。

所以，当我们说 X=C ∧ Rouge(X) ∧ Voiture(X) ∧ ¬Chère(X) ，意味着 X 必须是 C，且 X 必须是红色汽车，且 X 不昂贵，这三个条件同时满足时，这个表达式才为真。

而当我们说，意味着如果 X 不是 C 且 X 是红色汽车，那么 X 必须是昂贵的。这里的蕴含关系允许在 X 不是红色汽车或 X 是 C 的情况下，表达式也可以为真。

21. 问题21

The text in the image is a multiple-choice question, and it reads图片中的文字是一个关于逻辑公式解释的选择题，内容是:

"Let X and Y be variables and f be the formula ∀X∀Y X≠Y."设 X 和 Y 是变量，f 是公式 ∀X∀Y X≠Y.

Please choose an answer请选择一个答案:

a. Alors, il n'y a aucune interprétation pour la formule f 那么，对于公式 f 没有可能的解释

Then there is no possible interpretation for f那么就是没有可能的解释给 f

b. Alors, il existe une infinité d'interprétations mais aucun modèle那么，存在无限多种解释但没有单一模型

Then there are infinitely many interpretations but not a single model那么有无限多种解释但不是一个单一模型

c. Alors, il existe une infinité d'interprétations mais un modèle unique那么，存在无限多种解释但有唯一模型

Then there are infinitely many interpretations and a unique model 那么有无限多种解释和一个唯一模型

d. Alors, il existe une infinité d'interprétations et une infinité de modèles那么，存在无限多种解释和无限多种模型

Then there are infinitely many interpretations and infinitely many models"那么有无限多种解释和无限多种模型"

The correct answer to this question is 正确答案是:

c. Alors, il existe une infinité d'interprétations mais un modèle unique那么，存在无限多种解释但有唯一模型

Then there are infinitely many interpretations and a unique model 那么有无限多种解释和一个唯一模型

The formula ∀X∀Y X≠Y is making a universal statement that for all pairs of variables X and Y in the domain, X is not equal to Y. This can be interpreted in many ways depending on the domain, but if we assume the standard interpretation of ≠ to mean "not equal," there is a unique model where the domain consists of at least two elements (since no element can be equal to itself to satisfy X≠Y for all X and Y). If the domain has only one element, then the formula would be false because there would be a case where X and Y are the same element, which would make X≠Y false. Therefore, the formula is only true in models where the domain has more than one distinct element.

公式 ∀X∀Y X≠Y 声明了在域中所有变量对 X 和 Y，X 不等于 Y。这个声明可以根据域的不同有无限多种解释，但如果我们假定 "≠" 意味着 "不等于" 的标准解释，那么就会有一个唯一的模型，即域至少包含两个元素（因为为了满足 ∀X∀Y X≠Y，没有元素能够等于它自身）。如果域只有一个元素，那么公式将是错误的，因为会存在 X 和 Y 是同一个元素的情况，这会使得 X≠Y 为假。因此，这个公式只在域中有超过一个不同元素的模型中为真。