win10 cpu 下使用Xinference来进行大模型的推理测试

创建环境
conda remove --name xinference --all
conda create --name xinference python=3.10
conda activate xinference

#仅cpu
pip install xinference --force -i https://pypi.tuna.tsinghua.edu.cn/simple #
pip install “xinference[transformers]” -i https://pypi.tuna.tsinghua.edu.cn/simple
xinference-local
#下载
#https://github.com/abetlen/llama-cpp-python/releases/download/v0.2.55/llama_cpp_python-0.2.55-cp310-cp310-win_amd64.whl
#pip install D:\cuda\llama_cpp_python-0.2.55-cp310-cp310-win_amd64.whl

#https://github.com/li-plus/chatglm.cpp/releases/download/v0.3.1/chatglm_cpp-0.3.1-cp310-cp310-win_amd64.whl
#pip install D:\cuda\chatglm_cpp-0.3.1-cp310-cp310-win_amd64.whl

#pip install “xinference[all]” -i https://pypi.tuna.tsinghua.edu.cn/simple #仅能用于linux
#pip install “xinference[vllm]” -i https://pypi.tuna.tsinghua.edu.cn/simple #仅能用于linux
#pip install ‘xinference[sglang]’ -i https://pypi.tuna.tsinghua.edu.cn/simple #仅能用于linux

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-14 08:00:02       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-14 08:00:02       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-14 08:00:02       58 阅读
  4. Python语言-面向对象

    2024-07-14 08:00:02       69 阅读

热门阅读

  1. jenkins

    jenkins

    2024-07-14 08:00:02      21 阅读
  2. SQL注入安全漏洞与防御策略

    2024-07-14 08:00:02       29 阅读
  3. MocoInverse接口使用教程

    2024-07-14 08:00:02       33 阅读
  4. python datetime库与时间戳timestamp的转换

    2024-07-14 08:00:02       22 阅读
  5. zookeeper在哪里能用到

    2024-07-14 08:00:02       20 阅读
  6. 开源科学工程技术软件

    2024-07-14 08:00:02       17 阅读
  7. 2060:【例1.1】计算机输出

    2024-07-14 08:00:02       25 阅读
  8. Debian ip6tables allow IPv6 traffic on TCP port 18917

    2024-07-14 08:00:02       26 阅读