React中实现大模型的打字机效果

React 想实现一个打字机的效果,类似千问、Kimi 返回的效果。调用大模型时,模型的回答通常是流式输出的,如果等到模型所有的回答全部完成之后再展示给最终用户,交互效果不好,因为模型计算推理时间比较长。本文将采用原生 React 写一个简单的组件,调用本地 Ollama 模型进行对话。

服务端实现

由于要流式返回数据数据,正常的 http 请求是一来一回,不会一段一段返回,Websocket 是一个解决方案,Websocket比较重,模型对话只需要单向的返回就可以。所以,OpenAI提供的 API是基于 SSE (Server Sent Event)协议的,SSE 协议采用 Http Chunk Response 实现。下图中可以看到,Response 是 Chunked 编码的。
在这里插入图片描述

客户端实现

通过 Fetch 调用 Ollama 提供的接口,并对返回进行处理,Fetch API 默认支持 Chunk 编码。由于是流式输出,需要定义从 Reponse body 中获取一个 reader,代码如下:

import React, { useState, useEffect } from 'react';

const ChunkedJSONResponseComponent = () => {
  const [responses, setResponses] = useState([]);
  const [loading, setLoading] = useState(true);

  useEffect(() => {
    const fetchData = async () => {
      const response = await fetch('http://10.91.3.116:11434/api/generate', {
        method: 'POST',
        headers: {
          'Content-Type': 'application/json'
        },
        body: JSON.stringify({
          model: "testllama3",
          prompt: "Why is the sky blue?",
          stream: true
        })
      });

      const reader = response.body.getReader();
      const decoder = new TextDecoder();
	  #处理返回值
      const processChunk = ({ done, value }) => {
        if (done) {
          console.log('Stream complete');
          setLoading(false);
          return;
        }

        const chunk = decoder.decode(value, { stream: true });
        const lines = chunk.split('\n').filter(line => line.trim() !== '');

        lines.forEach(line => {
          try {
            const jsonObject = JSON.parse(line);
            setResponses(prevResponses => [...prevResponses, jsonObject.response]);
          } catch (e) {
            console.error("Failed to parse JSON:", e);
          }
        });

        reader.read().then(processChunk);
      };

      reader.read().then(processChunk);
    };

    fetchData();
  }, []);

  return (
    <div>
      <h1>Chunked JSON Response</h1>
      <p>
        {responses.map((response, index) => (
          <span>{response}</span>
        ))}
      </p>
      {loading && <div>Loading...</div>}
    </div>
  );
};

export default ChunkedJSONResponseComponent;

请添加图片描述

总结

OpenAI 设计的接口比较简单,后续出来的大模型都遵循了 OpenAPI 的接口格式,感谢各位大佬没有再造轮子。打字机效果实现很简单,由于原生 Fetch API 就支持 Chunk 编码,做对应的处理既可以完成。

相关推荐

  1. Unity Text文本实现打字机(一个一个出来)效果

    2024-06-06 10:18:05       32 阅读
  2. vue2 el-input里实现打字机 效果

    2024-06-06 10:18:05       33 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-06 10:18:05       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-06 10:18:05       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-06 10:18:05       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-06 10:18:05       20 阅读

热门阅读

  1. k8s使用yml文件部署

    2024-06-06 10:18:05       7 阅读
  2. debian常用命令

    2024-06-06 10:18:05       8 阅读
  3. Server did not offer supported security type!问题解决

    2024-06-06 10:18:05       8 阅读
  4. hnust 湖南科技大学 2022 软件测试报告+代码

    2024-06-06 10:18:05       9 阅读
  5. C#面:XML与 HTML 的主要区别是什么

    2024-06-06 10:18:05       9 阅读
  6. Django前端页面-模板继承

    2024-06-06 10:18:05       7 阅读
  7. Qt6弃用了QRegExp,改为QRegularExpression

    2024-06-06 10:18:05       10 阅读
  8. 在Web应用中如何处理会话跟踪

    2024-06-06 10:18:05       9 阅读
  9. 网络安全实战基础——实战工具与攻防环境介绍

    2024-06-06 10:18:05       9 阅读
  10. linux服务器配置openssl

    2024-06-06 10:18:05       9 阅读