Python实现视频转音频、音频转文本加文本实体识别

概述

本教程希望可以识别出目前活跃的视频平台(例如抖音、快手等)中视频文案中蕴含的实体信息,首先有两条技术路径:

  1. 直接提取视频帧,之后实现逐帧的字幕识别,最后合并为视频文案。
    优点:准确性高;
    缺点:首先不是所有视频都有字幕,另外对计算资源要求很高,逐帧识别非常耗时。
    tips:有的视频会对重点字幕使用另外的颜色,或者放大字体等方式。
  2. 视频先转为音频文件,音频文件使用接口再转为中文文本。
    优点:速度快,成本低。
    缺点:准确性较差,首先依赖于语音转文字的准确率,对于特有名词等,以及方言
    口音的识别较差,很难完全准确识别。
  3. 可以在理论上考虑两者方法的合并。

必备第三方库

  • moviepy&#

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-03-16 05:38:04       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-03-16 05:38:04       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-03-16 05:38:04       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-03-16 05:38:04       18 阅读

热门阅读

  1. 零基础入门多媒体音频(2)-音频焦点

    2024-03-16 05:38:04       18 阅读
  2. Android11 FallbackHome启动和关闭流程分析

    2024-03-16 05:38:04       17 阅读
  3. 《网络安全法》关于数据出境的条款

    2024-03-16 05:38:04       18 阅读
  4. springboot基础配置

    2024-03-16 05:38:04       20 阅读
  5. k8s系列-kubectl 命令快速参考

    2024-03-16 05:38:04       17 阅读
  6. K8S CNI

    K8S CNI

    2024-03-16 05:38:04      18 阅读
  7. k8s中 容器、pod服务、svc服务 这几个的区别

    2024-03-16 05:38:04       16 阅读
  8. k8s admin 用户生成token

    2024-03-16 05:38:04       17 阅读
  9. 安装k8s集群

    2024-03-16 05:38:04       17 阅读
  10. 24计算机考研调剂 | 太原科技大学

    2024-03-16 05:38:04       18 阅读