python实现将ChatGPT生成的数据,处理成UniCOQE的格式

目录

问题描述:

问题解决


问题描述:

原始数据存储在一个.txt文件中,存储格式如下:

如何将按照上面格式存储的内容,修改成下面的格式(方便UniCOQE处理):

注意:

index从0开始计数

问题解决

generated_path= "/home/qtxu/UniCOQE_20230812/data/tuple/car/train_three_combined.txt" # 原始路径
Unicoqe_path = "/home/qtxu/UniCOQE_20230812/data/tuple/car/train.txt" # 修改之后的保存路径

with open(generated_path, 'r') as fr, open(Unicoqe_path, 'w') as fw:
    read_lines = fr.readlines()
    for line in read_lines:
        try:
            sent, label = line.strip().split("\t")
            fw.write(sent+"####")
        except:
            span_index =[]
            cur_span = line.strip()[1:-1].split(';')
            sub, obj,asp = cur_span[0], cur_span[1], cur_span[2]

            for part in [sub,obj,asp]:
                part_index = [int(index) for index, word in (pair.split('&')for pair in part.strip()[1:-1].split())] 
                span_index.append(part_index)
            
            fw.write(str(span_index)+"\n")

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-29 05:26:03       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-29 05:26:03       106 阅读
  3. 在Django里面运行非项目文件

    2024-01-29 05:26:03       87 阅读
  4. Python语言-面向对象

    2024-01-29 05:26:03       96 阅读

热门阅读

  1. true friendship

    2024-01-29 05:26:03       52 阅读
  2. vue3使用特殊字符@、~代替路径src

    2024-01-29 05:26:03       64 阅读
  3. 【字节跳动】资深后端开发工程师-平台应用服务

    2024-01-29 05:26:03       56 阅读
  4. vue-cli 无法安装问题解决

    2024-01-29 05:26:03       57 阅读
  5. 典型相关分析

    2024-01-29 05:26:03       57 阅读
  6. leetcode670最大交换

    2024-01-29 05:26:03       56 阅读
  7. 驾照考试-科目二

    2024-01-29 05:26:03       52 阅读