返回文章列表
AI

大模型vs提示词工程vsRAG微调vsDify之间有什么关系?

妮伊
2025-12-05
5天前
大模型vs提示词工程vsRAG微调vsDify之间有什么关系?

搞透大模型本身

AI 产品经理跟普通人用 AI 不一样:

普通人跟 AI 的关系,类似主人身边的仆人,说啥做啥都在眼前,出问题了能第一时间控制补救

但 AI 产品经理跟 AI 关系,是皇上跟塞外将军的关系

你设计了个 AI 产品上线以后,大模型给你上演“将在外君命有所不受”的戏码,就完蛋了。



所以,你必须得把这“大将军”的脾气特性搞得非常透彻,并且确保能有效控制他。

大模型的核心原理,你不搞透的话,肯定可控制不住。

不需要啃论文,但是必须把两件事吃透:

1. 大模型训练流程

预训练做了什么事、得到了个什么东西

微调阶段做了什么事、得到了个什么东西、造成了什么弊病

RLHF 阶段做了什么事、埋下了什么隐患

比如,大模型的幻觉,仅仅是因为你问的问题它不知道么?

比如,都是拿公开数据训练的模型,为什么每家模型输出内容的风格不一样?

比如,为啥很多国内的大模型回答问题的开头和结尾跟 GPT 一模一样?

你得知道,这些都不是偶然,是训练方式带来的副作用。

2. 大模型的推理原理

首先,你应该知道了,大模型“思考问题”的方式跟人是不一样。

它给你输出的每个字,都像我们玩狼人杀“投si”的那个人一样,猜出来的。

不开玩笑,你把大模型的推理原理搞明白以后,再跟玩狼杀人白天投票的环节比一比就会发现,一毛一样。


这个底层原理,造就了大模型的种种弊病:

比如,数学计算很糟糕,连 9.8 和 9.11 谁大都不知道

比如,相同的问题每次输出的内容都不一样

比如,输入只要 1 块钱/百万 token,但输出却要 4 元

但凡你把这两件事吃透,就能理解提示词的重要性提示词工程在“工程”什么了



提示词和工程

“学”提示词你要天天满脑子想的是“套模板”,那就完蛋了。

提示词是连接你的需求模型能力的中间键,

那些“模板”都是从模型能力侧出发的,并且太过死板(甚至有些是为了死板而死板)

写提示词就两件事:

把事情想全面,提供完善的背景信息,别跟个“渣男”似得这不说、那不说的

把需求说清楚,提供清晰的任务目标,别跟个“渣女”似得啥也不说就“你猜”

(当然认同以上的前提是你吃透了大模型的原理)


那么所谓学习提示词,其实就是在学习怎么把一件事情表达清楚。

怎么学?

非常简单,透露一个小技巧。

魏源老师在清朝末期就通过《海国图志》教给我们了:“师夷长技以制夷”。

再说提示词工程:当你知道了大模型的缺陷,还又非得用它不可,就得想办法规避这些缺陷。

这就是工程的奥义。

所以,又绕回到大模型底层原理了。

我有总结四个法则,是这几年做项目、拆项目一轮轮归纳出来的,可以分享给大家:




RAG和微调

只靠提示词,很多问题依然是无解的。

比如,公开互联网上没有的信息,AI 是无论如何也不可能知道的。

比如,你想让大模型永远只输出一个特定结构的内容,纯靠提示词也很难搞。

这时就必须引入一些外挂能力来弥补缺陷。

幸运的是,你现在才开始学习成为 AI 产品经理,直接学习 RAG 和微调就好了。

放在 3 年前,连外挂都没有。

RAG,本质是给模型接一个“外挂知识库”。

但是可不是把文档上传到知识库那么简单,里面有很多不下手干不知道的细节

比如,文档分段你要选“自动分段”,就完蛋 30%了;

比如,不管 3×7=21 把文本段落直接向量嵌入,就又完蛋了20%;

比如,不管 6×7=43 无脑用语义检索,又得损失 10%的准确率;

还有,查询优化、向量模型选型、ReRank、提示词兜底……

这些都不知道的话,你的智能客服大概率会变成只能克服:“没办法,我不懂 AI,客户只能克服一下了。”

然后稍微说一下微调。

如果你不了解一下微调,就会像那些土老板们一样,“咱公司必须用微调大模型”。

微调的价值什么、什么时候微调、微调有多费劲

确保你了解了这些信息。

新时代的原型图

低代码产品在 2022 年都快黄了,突然因为 AI 的出现,一步成为「荣耀王者」

所以,Dify、Coze 这些产品,不要当成新东西来学。

它们的核心价值是帮我们快速验证想法,

可以让你在非常短的时间里,把一个 AI 产品的核心流程跑起来。

所以我把它们成为“AI 时代的原型图”

但是能跑的 MVP,可以拉上用户、小范围试一试,立刻知道方向大概对不对。

甚至拿到需求评审会上给老板演示价值,拿到产研对齐会上给技术讲实现逻辑。



如果你想要更进阶一点,产出“高保真原型”,甚至独立开发一个完整产品出来

也没啥难度。

Cursor、Claude Code 这些 AI 编程工具现在强到离谱

只要你能把需求说清楚,开发一款产品出来也就几分钟的事儿。

当然多少得了解一些编程相关的基本知识,

比如,程序是咋运行的、环境是啥

比如,前端网页代码长啥样、后端 JS 之类代码咋运行

甚至,终端怎么用、控制台咋打开,哪些是报错、哪些是日志……

本文内容仅供参考,不构成任何专业建议。使用本文提供的信息时,请自行判断并承担相应风险。

分享文章
合作伙伴

本站所有广告均是第三方投放,详情请查询本站用户协议