简单实用的企业舆情安全解决方案

前言:企业舆情安全重要吗?其实很重要,尤其面对负面新闻,主动处理和应对,可以掌握主动权,避免股价下跌等,那么如何做使用简单实用的企业舆情解决方案呢?

背景

好了,提取词写完了,直接说干货,首先说这件事的背景。公司是一家国内的企业,但是竞争对手全球都有,且最近忙着上市,负面信息呲呲往出冒,老板这个担心呐,想要一个企业舆情监控,掌握公司的一些新闻动态动态,重点还要有情感分析,而且重点说了,没有一点经费,好嘛,所有的商业舆情软件都不能考虑了。

基于这种0经费的舆情监控,作为一个工作10来年的安全员,自然是不能说自己不行,大不了我天天搜索引擎搜,然后抓新闻比对么。我绞尽脑汁的研究,还真的发现一套免费的方案。

方案

1.基于企业X通、X查查、爱X查等类型软件获取企业的各种经营预警信息,官方接口是需要付费的,不付费可以看(嘿嘿),甚至可以发邮件。这方法不就来了么。代码不能放(有协议),效果放一半大家看看

2.基于google alerts 全网搜常规企业新闻,类似于我们自己手动用搜索引擎搜索,只是google alerts把它自动化,首先要有一个google alerts账号,设置关键词,然后选择RSS发送或者邮件发送,关键词可以设置自己公司,也可以设置竞争对手公司,谷歌爬虫的强大,咋说呢,我拿我女神刘亦菲做测试,效果自己看。

RSS爬虫核心代码我就给大家放出来了,为啥敢放,因为RSS爬虫方案需要代理,而代理要钱,所以这个方案就放弃了。企业我使用的是邮件爬虫,不要钱,不是更好o(╥﹏╥)o,但是因为企业内部用,也就不能放出来。

# 核心代码,去掉了逻辑部分,数据库插入部分,和多组RSS部分,其实很简的,下面的可以执行单条RSS,自己按照自己需求改改就行了
import urllib.parse
try:
    with socket.create_connection((PROXY_HOST, PROXY_PORT), 3) as sock:
        sock.close()
        os.environ['HTTP_PROXY'] = "http://"+PROXY_HOST+":"+str(PROXY_PORT)
        os.environ['HTTPS_PROXY'] = "http://"+PROXY_HOST+":"+str(PROXY_PORT)
except socket.error as e:
    print(f"err:{e}")
    print("访问代理失败,退出采集程序")
    exit(1)
def extract_target_url(jump_link):
    # 解析查询参数
    parsed = urllib.parse.urlparse(jump_link)
    query_params = urllib.parse.parse_qs(parsed.query)
    
    # 查找'url'参数并解码
    encoded_target_url = query_params.get('url', [None])[0]
    if encoded_target_url:
        # 使用urllib.parse.unquote解码URL编码
        target_url = urllib.parse.unquote(encoded_target_url)
        return target_url
    else:
         return None

def Rssspider(rss):
    try:
        feed =feedparser.parse(rss)
    except:
        print(f"Error:{rss}地址错误或网络故障")
    for entry in feed.entries:
        tilte = entry.title.replace("<b>","").replace("</b>","").replace("...","")
        jump_link = entry.link
        summary = entry.summary.replace("<b>","").replace("</b>","").replace("...","")
        #新闻时间
        data =entry.published[:10]
        target_url = extract_target_url(jump_link)
        if target_url:
            print("link:",target_url)
        else:
            print("link:","")
            print("title:",tilte)
            print("summary:",summary)
            print("data:",data)

if __name__ == "__main__":
    Rssspider("https:/xxxx")
        

最后采集效果自己看,我不能说好,怕过度宣传,放个女神的采集结果给大家看看,这里面使用了个免费的情感分析库,效果很一般,想上情感分析的AI,但是接口要钱,自己内部搭建需要一个带卡的服务器,都没有,所以就使用了python的SnowNLP,效果极差,先对付用吧。后面有机会训练个小模型替代

相关推荐

  1. 企业网络安全全方位解决方案

    2024-07-18 17:30:04       27 阅读
  2. 企业网络安全CCRC认证解决方案

    2024-07-18 17:30:04       56 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-18 17:30:04       66 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-18 17:30:04       70 阅读
  3. 在Django里面运行非项目文件

    2024-07-18 17:30:04       57 阅读
  4. Python语言-面向对象

    2024-07-18 17:30:04       68 阅读

热门阅读

  1. python \uxx字符串转中文

    2024-07-18 17:30:04       18 阅读
  2. Qt 中的多线程管理方法详解及示例

    2024-07-18 17:30:04       16 阅读
  3. Qt QJson组装数据Sig传递

    2024-07-18 17:30:04       19 阅读
  4. Fundamentals of Computer Science LCSCI4208

    2024-07-18 17:30:04       20 阅读
  5. 河南萌新联赛2024第(一)场:河南农业大学

    2024-07-18 17:30:04       27 阅读
  6. Unity:UI进入离开事件

    2024-07-18 17:30:04       19 阅读
  7. opencv—常用函数学习_“干货“_6

    2024-07-18 17:30:04       18 阅读
  8. web前端 Vue 框架面试120题(四)

    2024-07-18 17:30:04       18 阅读
  9. 富格林:可信办法阻挠虚假受骗

    2024-07-18 17:30:04       19 阅读
  10. ClickHouse中使用UNION

    2024-07-18 17:30:04       20 阅读
  11. vue3项目中pinia的用法详解(值得收藏)

    2024-07-18 17:30:04       20 阅读
  12. jd-gui反编译出现中文乱码问题

    2024-07-18 17:30:04       18 阅读
  13. CL11命令行解析使用实例

    2024-07-18 17:30:04       19 阅读