Question 1

每周取消具体如何运作？

Accepted Answer

通过一条消息即可结束任何一周。无通知期、无离场访谈、无附加条款。我们按周开票，你最多承诺当前一周。

Question 2

如果工作没让我惊艳怎么办？

Accepted Answer

合同里就是这么写的：告诉我们，我们会退还那一周的费用。无需问询、无需争议账单、无需升级电话。唯一规则：退款适用于最近一周。

Question 3

为什么你们不计工时？

Accepted Answer

因为工时是错误的衡量标准。如果我们以计费工时为优化目标，就不是在为你的成果优化。我们的协议更简单：每一周，我们都赢得下一周。如果做不到，你不付款。我们可以投入零小时或六十小时。重要的是你是否被惊艳。

Question 4

「期望脱离现实」是什么意思？

Accepted Answer

我们和操盘手合作，不和买彩票的人合作。如果某个要求需要打破物理定律、法律或第三方系统，我们会明说，谈不拢就走人。这个保证是双向的：你可以任何一周解雇我们，我们也可以解雇自己。

Question 5

你们是一家 AI 公司吗？

Accepted Answer

是，而且是诚实的那种。我们是奥地利一支资深产品团队，端到端打造 AI Agent 和 AI 产品。和那些交付一个功能就走人的纯 AI 公司不同，我们接手整个构建：架构、评测、计费、可观测性。我们已经为 企业 AI 和 SaaS 客户 交付过这些。而且我们会告诉你什么时候 AI 是错的工具，哪怕这会让项目缩水。

Question 6

什么是 agentic SaaS，你们能做吗？

Accepted Answer

Agentic SaaS 是一种产品，核心工作由 AI Agent 完成，它跨工具做规划和执行，而不是在仪表盘上拧一个聊天机器人。能做：Agent 循环、工具集成，以及决定它能否经得起真实用户的那些不起眼的生产基建（鉴权、计费、评测、护栏、可观测性）。

Question 7

你们能用 AI 自动化我们的工作流吗？

Accepted Answer

能。AI 工作流自动化是我们最常做的 Agent 构建：分拣、内部研究、运营流水线，以及按计划无人值守运行的任务。我们把每个工作流锚定在 检索 和评测上，让你能衡量模型什么时候出错，而不是等客户来告诉你。我们也会告诉你哪些步骤更适合留给规则引擎。

Question 8

你们在奥地利做 AI Agent 开发吗？支持远程协作吗？

Accepted Answer

我们在奥地利蒂罗尔，以远程优先的方式与 DACH 地区及国际客户合作。时区重叠很大，我们在你的代码仓库和你的云上（AWS、GCP、Azure 或自托管）交付，所以我们在哪里通常不影响构建。

Question 9

你们做模型微调，还是只整合现有 API？

Accepted Answer

两者都做，看情况。90% 的业务场景中，提示工程做得好的前沿模型（OpenAI、Anthropic、Llama 等开源权重）以更低成本胜过自训微调。我们只在任务非常具体、数据是专有的、成本测算合理时才做微调。我们会诚实告诉你属于哪种情况。

Question 10

你们如何处理生产环境中的幻觉和可靠性问题？

Accepted Answer

三层防护：用 JSON Schema 校验结构化输出、用检索增强生成把模型锚定到你自己的数据源、在每次部署时用评测套件对真实响应打分。没有可衡量错误率的方法，我们不会上线 AI 功能。

Question 11

我们的专有数据存在哪里？你们用它来训练吗？

Accepted Answer

你的数据存放在你指定的位置。我们为你构建的产品运行在你自己的 AI 提供商许可证下，所以隐私条款就是你签的那一份。如果你和 OpenAI、Anthropic、Azure 等签了企业合同，你的数据在合同上就被排除在训练之外。如果你用的是默认套餐，把生产数据接进去之前请先看清楚提供商条款。对敏感场景，我们在你自己的云上（AWS Bedrock、GCP Vertex 或自托管）部署开源权重模型，问题就不存在了。我们绝不会用你的数据为其他人训练任何东西。

Question 12

从想法到生产级 AI 功能的典型周期？

Accepted Answer

原型：一周。带评测、护栏和可观测性的生产就绪版本：4-8 周。慢的不是 AI，是周边一切：鉴权、计费、限流、内容审核、审计日志。我们交付过足够多的项目，知道时间到底花在哪里。

Question 13

你们在生产环境用哪些 AI 框架和库？

Accepted Answer

看做什么。RAG 和 Agent：LangChain、LangGraph、LlamaIndex，前端配 Vercel AI SDK。自托管推理：vLLM、Ollama、llama.cpp、Hugging Face Transformers。评测：Braintrust、Phoenix、OpenAI evals。可观测性：LangSmith、Helicone、Langfuse。我们选枯燥、经过验证的工具，不追风口，AI 栈每六周就变一次，所以我们只选可以干净拔掉的东西。

Question 14

做一个 AI 功能到底要花多少钱？

Accepted Answer

在现有应用上做 prompt 工程整合：5,000-15,000 欧元。给你自己文档做的 RAG 系统，带评测和真实 UI：15,000-40,000 欧元。带工具、记忆和护栏的多步 Agent：40,000-100,000 欧元起。运行时 API 成本另算，看模型和 token 量。我们会把 API 预算直接写进报价单，省得你第二个月被 OpenAI 的账单吓到。

Question 15

我们会被锁死在某一个模型或供应商上吗？

Accepted Answer

只要做得对就不会。我们把业务逻辑和模型隔开，放在一个路由层后面，所以把 GPT 换成 Claude、Gemini 或 Llama 这样的开源权重模型，是改配置，不是重写。我们在你的代码仓库和你的云上交付，对敏感或对成本敏感的负载，我们运行由你自己托管的开源权重模型。代码和基础设施都归你。锁定风险是真实存在的，我们从第一天就按防住它来设计架构。

Question 16

我们什么时候不该往产品里加 AI？

Accepted Answer

一个 SQL 查询、一个规则引擎或一个表单就能搞定的时候。需要 200ms 以下延迟的时候。需要 100% 确定性输出的时候（法律合同、财务记账、医疗剂量）。没有反馈回路来发现模型出错的时候。如果场景不值得，我们会直接说「别做」，哪怕这意味着项目缩水。

Question 17

你们做的是真能执行动作的 AI Agent，还是只是聊天机器人？

Accepted Answer

真 Agent。我们做的 AI Agent 会调用工具（function calling、MCP），执行多步骤计划（LangGraph 状态机），读写你的数据库和 API，按计划无人值守运行。已交付案例：发票分拣机器人、内部研究 Agent、内容运营流水线、自动 QA harness。聊天机器人是无聊的情况。能推动工作的 Agent 才是杠杆所在。

Question 18

我们想在内部用 AI，而不是做一个 AI 产品。你们能帮忙吗？

Accepted Answer

那是另一项服务：AI Enablement。这个页面讲的是为你的客户构建 AI 产品。如果你的目标是给自己团队减负（自动化内部流程、做工作坊、在你自己的基础设施上搭建工具），请从那里开始。

能在生产环境中存活的 AI Agent 与 AI 产品

为什么大多数 AI 项目从没上线

我们做什么

从使用场景到生产

探查

架构

锚定

评测

护栏与可观测性

上线与交接

我们构建所用的生产技术栈

要花多少钱

我们在 AI 工作中遵循哪些原则？

用案例说话，而不是承诺

客户怎么说

常见问题

更多 AI 与前沿技术

了解我们