看做什么。RAG 和 Agent:LangChain、LangGraph、LlamaIndex,前端配 Vercel AI SDK。自托管推理:vLLM、Ollama、llama.cpp、Hugging Face Transformers。评测:Braintrust、Phoenix、OpenAI evals。可观测性:LangSmith、Helicone、Langfuse。我们选枯燥、经过验证的工具,不追风口,AI 栈每六周就变一次,所以我们只选可以干净拔掉的东西。
在现有应用上做 prompt 工程整合:5,000-15,000 欧元。给你自己文档做的 RAG 系统,带评测和真实 UI:15,000-40,000 欧元。带工具、记忆和护栏的多步 Agent:40,000-100,000 欧元起。运行时 API 成本另算,看模型和 token 量。我们会把 API 预算直接写进报价单,省得你第二个月被 OpenAI 的账单吓到。