大佬们，求助本地部署大模型

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 292 天前的主题，其中的信息可能已经有所发展或是发生改变。

有下面几个要求：

1 、本地部署开源的大模型

2 、有知识库管理

3 、可提供接口

有没有满足的产品呀

部署

知识库

接口

39 条回复 • 2024-12-12 16:38:34 +08:00

2kCS5c0b0ITXE5k2

292 天前

ollama AnythingLLM

andytao

292 天前

https://github.com/karpathy/llama2.c

NoobNoob030

292 天前

1. 大模型单独部署，huggingface 或者魔搭社区看看文档就能部署
2. 知识库管理+接口这种 AI 平台，想傻瓜式开箱即用的，国内推荐 fastgpt ，国外推荐 langflow 。想自己开发就用 langchain

jjyyryxdxhpyy

292 天前

@NoobNoob030 谢谢

jjyyryxdxhpyy

292 天前

@andytao 谢谢，我看看

jjyyryxdxhpyy

292 天前

@emeab ollama 我知道，本地部署了，现在在想怎么集成知识库

andytao

292 天前

https://github.com/ggerganov/ggml
https://github.com/ggerganov/llama.cpp
https://github.com/chenyangMl/llama2.c-zh
https://ai.gitee.com/
https://gitcode.com/ai-copilot

andytao

292 天前

楼主考虑的是编程集成吧？

比如用已有知识库训练模型，调用 API 输出想要的结果等，最好把后续细节细化一下，或许有更多有可行性的建议；

seeyourface

292 天前

同问，通过知识库外部引用和使用知识库作为训练集微调模型，有没有这方便的大佬知道哪种方式的效果更好吗

jjyyryxdxhpyy

292 天前

@andytao 是这样，本地部署一个类似 ollama 的服务，集成开源大模型，然后基于这个模型，集成知识库，对面前端来说，可以调用接口，做进一步修改，适配项目

jjyyryxdxhpyy

292 天前

@andytao 谢谢，我看看

Lockeysama

292 天前

本地模型和其它可以分开的话，可以试试 https://github.com/langgenius/dify
支持接入本地模型

tricker1215

292 天前

话说有没那些本地“小模型”。
基于特定的文本内容做成一个问答机器人，文本内容短，但是准确性要求高。

fredweili

292 天前

hugging face 去找找

jjyyryxdxhpyy

292 天前

@fredweili 太难找了

jjyyryxdxhpyy

292 天前

@tricker1215 这不就是，和我要求差不多，本地部署，需要集成知识库

jjyyryxdxhpyy

292 天前

@Lockeysama 可以

NewHere

292 天前

英伟达的 Chat with RTX 呢，那个好像是分析本地文件的

kuqma98

292 天前

Langchain-chatchat

supergeek1

292 天前

https://github.com/chatchat-space/Langchain-Chatchat
这个应该完全符合你的要求，支持本地模型、知识库管理问答、API 页面都有

jjyyryxdxhpyy

292 天前

@supergeek1 可以可以，感谢

jjyyryxdxhpyy

292 天前

@kuqma98 感谢

supergeek1

292 天前

@jjyyryxdxhpyy #21 不过这个项目的代码感觉有点杂了（好像也快出 0.3 版本了），如果会开发的话你的需求用 langchain+fastapi 搞一搞也很快能实现

wwhc

292 天前

github.com/zylon-ai/private-gpt

echoyangjx

292 天前

网易有道这个满足你的需求，https://qanything.ai/

Adelell

292 天前 via iPhone

https://lmstudio.ai/

jackrebel

292 天前

留眼学习

jjyyryxdxhpyy

292 天前

@wwhc 收到

isquare

292 天前

fastgpt 比较符合你的需求，dify 我也用过，但是好像外国人做的水土不服。再一个它支持可视化的高级编排 workflow ，上手比较容易，很方便快速搭建。

1. 本地部署开源大模型，这一点跟知识库本身没关系，你自己随便部署

2. 知识库，fastgpt 我觉得做的比较好，它比较早使用 QA 问答对儿的模式去构建知识库，后来其他框架比如 dify 也抄了这个模式

3. fastgpt 的知识库接口兼容 openai 接口的调用，也有自己的格式（用 chatid 存储对话历史之类的），调用比较方便

jjyyryxdxhpyy

292 天前

@isquare 非常感谢