语义检索系统排序阶段使用PaddleInference进行模型推理

2024-07-10 22:24:03
开发
11

import os
import sys
from scipy.special import softmax
from scipy.special import expit
import numpy as np
import pandas as pd
import paddle
from paddle import inference
import paddle.nn.functional as F
from paddlenlp.data import Stack, Tuple, Pad
from paddlenlp.datasets import load_dataset
from paddlenlp.utils.log import logger
from paddlenlp.transformers import AutoTokenizer, AutoModel
sys.path.append('.')

max_seq_length=128
batch_size=32
model_dir= './output'
model_file = model_dir + "/inference.predict.pdmodel"
params_file = model_dir + "/inference.predict.pdiparams"
use_tensorrt=True
model_name_or_path='ernie-3.0-medium-zh'
input_file ='./datasets/yysy/sort/test_pairwise.csv'

config = paddle.inference.Config(model_file, params_file)

paddle.set_device('gpu')

config.enable_use_gpu(100, 0)

precision_map = {
            "fp16": inference.PrecisionType.Half,
            "fp32": inference.PrecisionType.Float32,
            "int8": inference.PrecisionType.Int8
        }

precision='fp32'

precision_mode = precision_map[precision]

# if use_tensorrt:
#     config.enable_tensorrt_engine(max_batch_size=batch_size,
#                                   min_subgraph_size=30,
#                                   precision_mode=precision_mode)

config.switch_use_feed_fetch_ops(False)

predictor = paddle.inference.create_predictor(config)

predictor.get_input_names()

input_handles = [
        predictor.get_input_handle(name)
        for name in predictor.get_input_names()
    ]

output_handle = predictor.get_output_handle(
predictor.get_output_names()[0])

tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)

def read_text_pair(data_path):
    with open(data_path, 'r', encoding='utf-8') as f:
        for line in f:
            data = line.rstrip().split("\t")
            if len(data) != 3:
                continue
            yield {'query': data[0], 'title': data[1]}

test_ds = load_dataset(read_text_pair,
data_path=input_file,
lazy=False)

data = [{'query': d['query'], 'title': d['title']} for d in test_ds]

batches = [
        data[idx:idx + batch_size]
        for idx in range(0, len(data), batch_size)
    ]

def convert_example(example, tokenizer, max_seq_length=512, is_test=False):
    query, title = example["query"], example["title"]
    encoded_inputs = tokenizer(text=query,
                               text_pair=title,
                               max_seq_len=max_seq_length)
    input_ids = encoded_inputs["input_ids"]
    token_type_ids = encoded_inputs["token_type_ids"]
    if not is_test:#非测试，评估返回
        label = np.array([example["label"]], dtype="int64")
        return input_ids, token_type_ids, label
    else:#测试返回
        return input_ids, token_type_ids

results = []
for batch_data in batches:
    examples = []#保持每个样本的token和token_type，数字形式
    for text in batch_data:
        input_ids, segment_ids = convert_example(
            text,
            tokenizer,
            max_seq_length=max_seq_length,
            is_test=True)
        examples.append((input_ids, segment_ids))
    batchify_fn = lambda samples, fn=Tuple(
        Pad(axis=0, pad_val=tokenizer.pad_token_id, dtype="int64"), # input
        Pad(axis=0, pad_val=tokenizer.pad_token_id, dtype="int64"
            ), # segment
    ): fn(samples)
    input_ids, segment_ids = batchify_fn(examples)
    input_handles[0].copy_from_cpu(input_ids)
    input_handles[1].copy_from_cpu(segment_ids)
    predictor.run()
    sim_score = output_handle.copy_to_cpu()#本来这个处理就是概率了
#     print('1',sim_score[0][0])
#     sim_score = expit(sim_score)#sigmoid
#     print('2',sim_score[0][0])
    results.extend(sim_score)

for idx, text in enumerate(data[:20]):
print('Data: {} \t prob: {}'.format(text, results[idx]))

原文地址:https://blog.csdn.net/LIjin_1006/article/details/140162149 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1811043711270916096.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

语义检索系统排序阶段使用PaddleInference进行模型推理

相关推荐

最近更新

热门阅读