大模型调用与工程实践概览

Civi2025/12/5大约 3 分钟

这一篇算是一个「总纲」，后续可以把其中的某些小节拆成独立文章。

1. 一个典型的大模型调用链

从工程视角看，大致会包含：

很多问题其实不是出在「模型本身」，而是出在这些环节的设计不清晰。

或者直接要求返回 JSON，方便程序再处理。

对话中累积上下文对于多轮问题，可以在后端显式维护「对话历史」，必要时做压缩或摘要。

请求时间、耗时、模型名称；

Prompt（必要时做脱敏处理）；

模型输出（同样注意隐私与安全）；

错误类型（超时、限流、解析失败、业务异常……）。

这些数据可以用来：

统计模型的平均响应时间、错误率；

回溯某次「回答离谱」时的上下文；

迭代 Prompt 设计和参数设置。

作为「智能助手」嵌在某个页面里；

在后台做批处理（例如批量生成报告草稿、摘要）；

作为一个可选的「建议模块」，由人来最终确认。

工程上需要注意：

幂等性：同一请求是否会被重复发送？会不会重复写入结果？

限流与熔断：不要让上游的流量尖峰直接砸在模型服务上；

回退策略：模型服务不可用时，系统是否还有可用的降级方案。

简单的 RAG（检索增强生成）工程实践；

向量数据库（如 Milvus / Qdrant / pgvector）的基本使用笔记；

工具调用 / 代码执行代理的一些实验记录；

如何为大模型服务加上监控、告警和简单的「健康检查」页面。

打开 GitHub 仓库 civi-wiki；
依次编辑这些文件，把内容全部替换成上面给你的版本：
- package.json
- src/.vuepress/config.ts
- src/.vuepress/theme.ts
- src/README.md
- src/about/README.md
- src/dev/README.md
- src/dev/vuepress-basic.md
- src/law/README.md
- src/law/internship-notes.md
每个文件改完点一次 Commit changes（或者全改完一起提交也可以）；
提交到 main 分支后，Cloudflare Pages 会自动重新构建；
构建完成后，用你的自定义域名打开，看一下：
- 顶部导航变成「首页 / 系统 & 开发 / 大模型随笔 / 关于」；
- 侧边栏里每个栏目都有内容可以点进去浏览。

如果你之后想再继续扩展，比如给「大模型随笔」再加几篇单独文章，我也可以直接帮你设计新的文件名 + 完整 Markdown 内容，你只要照着创建即可。 ::contentReference[oaicite:0]{index=0}