python 高速去重比list 快速

python 高速去重比list 快速

高速去重代码

from  glob import glob
from tqdm import tqdm
path_list=glob("E:/sky_150b/任务组_20231207_2023/*")
for one in tqdm(path_list):

    with open(one,"r",encoding="utf-8") as f:
        data=f.readlines()
    data_list={
   }
    for i in tqdm(data):
        if data_list.get(i,False)==False:
            data_list[i]="1"

    with open(one, "w", encoding="utf-8") as f:
        f.writelines([i for i in data_list.keys()])


高速去重解析

该段代码使用了python中的glob和tqdm库,glob用于匹配满足某个规则的文件路径列表,tqdm用于显示进度条。
首先,通过glob匹配所有指定路径下的文件,然后遍历每个文件,使用with open语句以只读方式打开文件,并使用utf-8编码读取文件的全部内容。接着,使用一个字典类型变量data_list来记录每个不重复的行,并将每行内容作为字典的键。如果数据已存在于字典中,则不会添加。最后,再次使用with open语句以只写方式打开原文件,并使用utf-8编码将字典中的每个键写入文件中。因为字典的键是唯一的,所以写入后的文件中所有行都是唯一的,没有重复内容。

相关推荐

  1. python 高速list 快速

    2023-12-11 04:06:02       58 阅读
  2. List的五种方法

    2023-12-11 04:06:02       39 阅读
  3. list排序根据某个字段

    2023-12-11 04:06:02       43 阅读
  4. python进行字典

    2023-12-11 04:06:02       33 阅读
  5. List数据的4种有效方法

    2023-12-11 04:06:02       45 阅读
  6. Python】如何实现交叉匹配后

    2023-12-11 04:06:02       57 阅读
  7. Python】案例:多维列表拆分和

    2023-12-11 04:06:02       48 阅读
  8. Python 字典组成的数组怎么进行?

    2023-12-11 04:06:02       47 阅读
  9. oracle

    2023-12-11 04:06:02       59 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-11 04:06:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-11 04:06:02       106 阅读
  3. 在Django里面运行非项目文件

    2023-12-11 04:06:02       87 阅读
  4. Python语言-面向对象

    2023-12-11 04:06:02       96 阅读

热门阅读

  1. 2023阿里智能互联算法工程师 机器学习一面

    2023-12-11 04:06:02       54 阅读
  2. Linux下开发常用的CVS使用手册

    2023-12-11 04:06:02       48 阅读
  3. git 常用部分方法

    2023-12-11 04:06:02       37 阅读
  4. Git全局设置命令---设置提交人姓名

    2023-12-11 04:06:02       65 阅读
  5. 编程环境与平台

    2023-12-11 04:06:02       52 阅读
  6. QT linux下使用Qt Creator调试附加进程,加快调试

    2023-12-11 04:06:02       51 阅读
  7. SQL注入基础宝典(原理+详解)[每天更新]

    2023-12-11 04:06:02       56 阅读
  8. mysql设置为密码登录

    2023-12-11 04:06:02       54 阅读
  9. 如何用flex布局设计登录页?

    2023-12-11 04:06:02       60 阅读