手把手教你将公众号历史文章打造成知识库机器人

  大家好,我是木川

想象你的公众号文章就像是一盘盘美味的佳肴,每一道都有独特的风味和营养。但现在,这些佳肴只是摆在厨房里,等着有人来品尝。

今天,我就来手把手教你,如何把这些美味佳肴变成一个随叫随到的“智能小厨”,不管什么时候,只要你需要,它都能迅速端出你想要的“知识美食”。让我们一起来打造这个智能小厨,让你的公众号文章变成随时待命的知识宝库!

为了让这个流程变得更简洁易懂,就像是在家里做菜一样,可以这样描述:

1、收集食材(信息整合):把公众号里的文章都收集起来,就像是在市场上挑选新鲜的食材

2、准备菜单(创建知识库):整理这些文章,就像是在准备一份份精美的菜单,让每一篇文章都成为一道美味的“知识佳肴”。

3、安排上菜顺序(创建工作流):决定这些“知识佳肴”怎么呈现给客人,也就是设置好机器人的工作流程,让它知道什么时候该提供什么样的信息。

4、雇佣厨师(创建 Bot):现在需要一个“厨师”来执行这些任务,也就是创建一个AI 机器人,让它来管理我们的知识库。

5、开门迎客(发布):最后,我们要把一切都准备好,然后就可以发布这个机器人,让它开始为我们的用户提供服务,就像餐厅开门迎客一样。

接下来,我们来看看主要的两个难点:

1、获取公众号历史文章并导出:对于不会编程的人来说,还是比较困难的,本文采用的方案,无须编程也能学会

2、创建 Bot:没有 AI 之前,没有开发经验也是比较困难的。本文采用低代码 Agent 开发平台 Coze 来创建和管理你的机器人,无须编程也能学会

文章比较长,可以先阅读下大纲:

073d1bcd3a1a46ebb5781134a9f14cee.png

开始之前,先演示下效果,我将 AI 机器人发布到 Coze Bots、微信公众号、飞书 3个平台,在各个平台上和 AI 机器人对话就像是和公众号作者对话一样

一、效果演示

1、提取文章关键词 - Coze Bot

分析已发表公众号文章关键词

5673eb100f3ff9f088cf54abcf29652c.png

2、推荐优质文章 -  微信公众号

从已发表公众号文章中,推荐用户需要的优质文章

8005520e45184adf4229502cfe22e82b.jpeg

3、获取高赞文章-飞书

获取高阅读量的文章拆解学习

b61ea5fd5e5c3e0361ea7e66087e6244.png

二、导出公众号历史文章

如果要实现上面的效果,首先需要将公众号历史文章作为知识库上传到智能体平台,所以我们介绍一种无需编程的方案导出公众号历史文章(包含发文时间、阅读量、点赞量、评论量等各个维度的数据)

wcplusPro 是一款专业的公众号数据软件,提供公众号文章采集、管理、分析、导出等多种功能,运行在桌面电脑上,支持 macOS、Windows、Linux。wcplusPro 发布于2018年,多年来持续深耕公众号数据分析,深受高校、新闻媒体、自媒体、数据公司青睐。

1、wcplusPro 安装

1)下载安装包

进入 wcplus 官网,根据自己的系统,点击下载不同的安装包**

比如我是 macOS M 系列芯片,就下载第一个安装包

ecc713e38295a14cefd4817d7c8c7a0f.png
2)解压

下载后解压放到自己希望安装的目录

解压后得到一个名称含有 wcplusPro 的文件夹。软件本身和采集的数据,都在该文件夹里

12221f7d637970362898173622d9cea9.png
3)运行脚本

进入文件夹,双击 run_wcplusPro_macos_apple_silicon.command 即可运行 wcplusPro

de614441ad05f1f4015e8eafa3c99db9.png

wcplusPro 会自动通过浏览器打开网页http://localhost:5001,这就是 wcplusPro 的用户界面,以后采集、导出、分析数据等工作,都会在这里完成。

8b591d7de3a9b0a0f53e0b9495e3cb02.png
4)安装证书

wcplusPro 采集数据需要知道公众号的昵称等信息,正确安装证书后,wcplusPro 才能识别到这些信息

确保 wcplusPro 已经运行,浏览器打开 http://localhost:5001,点击顶部设置菜单,下载证书

292ab326899006a5b06f41abda8f65ba.png

双击打开下载的证书文件 mitmproxy-ca-cert.pem,系统会通过钥匙串访问工具打开并安装该证书

868781a00cd844d413b2858ebe46ec16.png

在钥匙串访问工具输入 mit,找到刚才安装的证书文件。该证书显示为红叉,提示此根证书不被信任。

c944072f67c4aa4c7bfb3a22f016df1f.png

双击打开证书文件,选择始终信任,关闭证书窗口,输入密码并保存设置。

adb79bba7586b4985d679e7e6ba1abc1.png

2、公众号数据采集

1)识别公众号

wcplusPro 不是通过输入公众号名称进行采集的,需要通过微信客户端打开目标公众号进行识别,然后进行采集

点击任务菜单,点击 Set Proxy 按钮,让 wcplusPro 准备识别待采集公众号,确保下图3号标记状态变为绿色。

e462466bd5a01ecdbfabbd8f3ae0ca94.png

此时打开微信客户端,找到需要采集的公众号,打开其中任一篇文章,等待文章加载完成,直到wcplusPro 识别公众号

3abe795f423cc4da78d2fbd4c53e8f58.png

如果wcplusPro无法正常显示公众号的昵称,请鼠标右击该公众号文章,反复点击重新加载

f7caeda5939b168b4323ccbe577d4922.png

如果未识别公众号,可以看下官方视频

https://www.bilibili.com/video/BV12u411t7di/?vd_source=709f0ef880c674fe5146c5efda4af592

2)试用激活

每台电脑都可以免费试用 wcplusPro 1小时,期间足够完成1~2个公众号全部历史文章的采集。授权到期后,已采集的数据可永久查看

点击 wcplusPro 设置菜单、点击试用激活,如果你用户调研不感兴趣,可点击直接试用激活

5abcc40b504a63db54b2a2a2edcffd64.png

激活成功,可以看到授权 Key 和 授权过期时间

1b27817a984fe5a6e581b8e56b203f25.png
3)采集数据

点击文章链接、文章内容、阅读数据旁边的创建按钮,创建采集任务

点击开始按钮,即开始采集数据,等待任务自然完成即可

099bfd9b39b5e8e621c5d946fe518f02.png

采集完成后,在公众号列表可以看到采集的公众号

19c7123f643ebd6efa700348d2ed3b8e.png

点击导出按钮,可以导出 csv 格式的文章数据

aaaff48d193366cbab6225fd16e88119.png

点击统计按钮,可以看到公众号统计信息

90667200a11f53ff42ecd552407183a2.png

点击文章列表,可以点击字段进行排序,比如查看高阅读量的文章

780ff3403b63df449d8fef307c06fe3d.png
4)关闭 wcplusPro

关闭浏览器页面,并不能关闭 wcplusPro

使用期间,请保持 run_wcplusPro_macos_*.command 运行的窗口打开或最小化,这是 wcplusPro 的后台,关闭该窗口即可关闭 wcplusPro

三、创建 Coze 智能体

进入coze 官网 https://www.coze.cn/ 创建 AI bot

1、创建知识库

1)知识库入口

点击“个人空间->知识库->创建知识库”

ae32203139e71582424b098243fde499.png
2)填写知识库基本信息

填写知识库名称及描述,选择表格格式,导入类型选择本地文档,填写完成后,点击“确认”按钮

c3eb78c47b2adff5d026d434073aeecb.png
3)上传知识库文档

将上面导出的公众号文章文件上传,然后点击下一步,比如上传自己的公众号文章合集作为知识库

8418c88839daeecd75fe84ba0e386f65.png
4)配置索引列

上传文档后自动生成表结构,需要勾选索引列,用户 Query 会和该字段的内容做对比,根据相似度匹配

d4f390323f6e3b32095460a22c06610f.png
5)知识库预览

预览没有问题后,点击下一步就创建完成了

97c2c61c9ff1b641f3ba68c116700ab0.png

2、创建工作流

工作流本质是接收输入,按照一定的流程输出

1)工作流入口

点击“个人空间”-“工作流”-“创建工作流”

1ed7f65d73474fff5532b03d11dae705.png
2)填写工作流基本信息
e21e214527a9cbcf510c85a6231ff728.png

点击确认后,工作流只有开始和结束节点,代表输入和输出

e4740a5e7cc1a531ba8ac94c79eeb968.png
3)编辑开始节点

开始节点新增变量,命名为 ”question”,这个变量将存储用户的输入信息。

f93ed9f988e51930ec9edc6fae846cb5.png
4)新增知识库节点

从左侧菜单中选择“知识库”节点,添加到右边的面板中,并连接开始和结束节点

732dff090431bc185c7940ec2a19de29.png

输入参数 :Query 类型设置为引用,并关联到开始节点中的 question

点击知识库右边的“+”,选择上面建立好的知识库

搜索策略:建议选择“混合”,结合全文检索和语义检索的优势,并对结果进行综合排序召回相关的内容片段

最大召回量:从知识库中输出的最大段落数,数量越大,速度越慢

最小匹配度:根据设置的匹配度选取要返回给大模型的内容片段,低于设定匹配度的内容不会被返回

c6779f80bb745ee5274c10c8d91ffcb6.png
5)新增大模型节点

从左侧菜单中选择“大模型”节点,添加到右边的面板中,并连接知识库节点

a42b49edb03bb755c98a20f18cfe41f5.png

模型:选择“moonshoot(32k)”,即 Kimi 大模型,可以自定义模型参数

932c48806ff9f650ba539ebce7f9cfc4.png

输入参数:增加 question 和 knowledge,并引用用户输入的变量 “question” 和知识库输出的变量 “knowledge”

提示词:根据用户输入的内容和知识库输出的内容,让大模型根据规则为用户输出答案

# 角色
你是知识库问答小助手。你会接收两个输入:
1.{{question}}这个是用户询问的问题
2.{{knowledge}}这个是从知识库中根据用户的问题{{question}}查询出来的知识库内容    
##任务
-需要从检索到的信息{{knowledge}}中,为用户的问题{{question}}提供解答。让用户更方便的查询到AI相关的内容。
-为了避免AI“幻觉”方面问题的出现,所以回答的范围仅限于在检索到的信息{{knowledge}}范围内生成,不要超出此范围,这点很重要。
## 技能
###技能 1: 问题理解
-理解用户的问题{{question}},并识别其关键信息。
###技能 2: 回答生成
-基于检索到的信息{{knowledge}},为用户生成准确、简洁的回答。
##约束
-仅回答与产品相关的问题,不回答无关话题。
-尽量使用清晰简练的语言来回答用户的问题。
-整个回答过程中,始终以用户的需求为中心。
-所有回答只能在检索到的信息{{knowledge}}范围内生成,不允许自行生成其他无关回答,这一点请无论如何务必遵守。
-只要检索到信息{{knowledge}},无论用户的问题是什么,都要将信息{{knowledge}}用清晰简练的语言输出。
-如果没有检索到任何信息{{knowledge}},请直接生成如下回答:
'这次没找到别灰心,您可以尝试再试一次,或到公众号上查询'
-禁止输出与内容无关的符号信息和表格标题等,比如:"",{},brief,一级分类等

输出参数:大模型输出内容赋值为变量 “output"

6)编辑结束节点
a61f49f39d619715d4736f65c62e6c1c.png

回答模式:使用设定的内容直接回答

输出变量:用户输入的内容“question”,大模型输出的内容“answer”

回答内容:回答的内容带上{{question}}、{{answer}}这两个变量

7)试运行

点击”试运行“按钮

9db373dc58ac0d453672d04d355d8002.png

输入问题

7ff0fdcea71d029acb890257aaf46cc4.png

查看运行结果

659c3a9fac5ea52ba09236f64187f3dc.png
8)发布

试运行成功后后,就点击发布按钮

7093cee2aa225ddd2bfe81aa0df696c2.png

3、创建 Bot

1)Bot 创建入口
9b1a4ea2992c9a9ae7adcb90ecfaf9a8.png
2)填写 Bot 基本信息
9fce4117ab5d4e8ac922e1d0870a9d53.png
3)配置 Bot

配置提示词和工作流

bbd82f9694e8891c4b15cf4e9df4b869.png
4)预览调试
f9bbe7efc8a66823fa250cb69194e1d4.png
5)发布

勾选渠道进行发布

b31c45d9d157142874a6bcc837431682.png

发布成功后,就可以在相应的平台和机器人对话了

8dd75cd54624ff6c6cf44534b3f75083.png

四、总结

本文主要介绍了如何将微信公众号中的历史文章转化为一个智能问答系统,文章主要分为以下 3 个部分:

1、效果演示:展示了智能问答系统在实际应用中的三种场景,包括从文章中提取关键词、推荐优质文章和获取高赞文章。

2、导出公众号历史文章:介绍了使用 wcplusPro 软件来导出公众号历史文章的步骤,包括软件的安装、公众号数据的采集和导出。

3、创建 Coze 智能体:详细说明了在 Coze 平台上创建公众号智能体的过程,包括创建知识库、配置工作流、创建 Bot 和发布 Bot。

打造公众号知识库机器人,我认为至少有如下几种意义:

1、拆解对标:获取高阅标题、高赞文章进行拆解

2、节省时间:公众号运营者可以减少回答重复问题的时间,将更多精力投入到内容创作和用户服务上,提高工作效率

3、内容整合与管理:有助于读者快速找到所需信息,同时也方便公众号运营者对内容进行有效管理


今天的分享就到这里了,欢迎加我微信围观高质量朋友圈,回复【AI编程】获取优质AI 编程资料

6d104d1370b4ee2140058f7844e9588b.png

关注我的星球,分享 AI 技术和读书心得,置顶贴领取价值 999 元 的 AI 大礼包。

6021cce3e67baad549143decaea6d6e1.jpeg

最近更新

  1. TCP协议是安全的吗?

    2024-06-18 18:52:04       19 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-18 18:52:04       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-18 18:52:04       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-18 18:52:04       20 阅读

热门阅读

  1. android 常用工具

    2024-06-18 18:52:04       5 阅读
  2. mysql 存储过程 - 创建使用示例

    2024-06-18 18:52:04       10 阅读
  3. 微信小程序地图功能详解

    2024-06-18 18:52:04       7 阅读
  4. 决策树算法介绍:原理与案例实现

    2024-06-18 18:52:04       6 阅读
  5. C++中的::运算符

    2024-06-18 18:52:04       5 阅读
  6. 合并两个可能为空的List 的方法记录

    2024-06-18 18:52:04       5 阅读