核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
上一篇 : 仰望u9明明技术实力更强,为什么纽北的成绩没有小米su7ultra好?
下一篇 : 华为Pura 80首销遇冷,是否说明消费者已经开始对麒麟芯片性能有所觉醒?
为什么苹果手机杀后台现象频繁?是内存不够、后台管理严格还是其他原因呢?...
Trae和Cursor对比有什么优势吗?...
为什么从事技术的人普遍都比较难沟通?...
洲际导弹能打到任何地方,为什么还需要轰炸机?...