2023-2024山东大学软件学院web数据管理期末

一、填空(30*1' = 30')

都是PPT上的,这里列几个复习可能忽略掉的地方:

word2vec是用来计算____和___(king-man+woman)

爬虫模型使用___判重

fastText是一个_____和_____工具,使用_____方法/概念。

PLSA的全称是______。它通过文档-词项信息  p (w | d)  进行训练,得到______和________。

其余的题都比较基础,一眼能知道答案(只要好好看PPT了的话.....)

二、名词解释(5*8' = 40')

1. 正则表达式

2. web数据抽取

3. HMM模型

4. Bag of words model

5. 忘了(但不难)

三、简答题(3*10'=30')

1. 简述包装器,比较两种抽取方法

2. CBOW的结构、思想、训练过程及应用

3. 常用的图像局部特征,以及它们的思想

还是那句话,做好事积德……

最近更新

  1. TCP协议是安全的吗?

    2024-06-15 09:12:02       10 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-15 09:12:02       12 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-15 09:12:02       11 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-15 09:12:02       14 阅读

热门阅读

  1. 7号楼地面东照西和南照北

    2024-06-15 09:12:02       7 阅读
  2. 嵌入式linux中GPIO和Pinctrl子系统分享

    2024-06-15 09:12:02       6 阅读
  3. 双指针练习:三数之和

    2024-06-15 09:12:02       8 阅读
  4. C++ 字符串分割

    2024-06-15 09:12:02       5 阅读
  5. 2024最新前端技术趋势

    2024-06-15 09:12:02       7 阅读
  6. RichSinkFunction 在 Flink IoT 项目中的应用实战

    2024-06-15 09:12:02       4 阅读
  7. 6.2 文件的缓存位置

    2024-06-15 09:12:02       5 阅读
  8. 条件循环语句有哪些?语法?区别?

    2024-06-15 09:12:02       5 阅读