就 3.5-turbo 的效果来说,我觉得它更适合的用法是 Prompt 中给出一些信息,然后让 LLM 基于这些信息构造或转换成另一种形式的信息(中间可能涉及一定的推理)。
比如自然语言写代码就是一类,还有一个我在探索的做法是把自然语言的 etymology 描述转换成结构化的描述:
https://gist.github.com/secondwtq/d00ea3a0d88c6098a57b0dba04054466 注意这里面的 etymology 数据是我自己事先从 wiktionary 里面抄下来给它的,你直接问它 etymology 它也知道,但是结果就不那么可靠。Changelog 推过一篇文章把 LLM 比作“calculator for words”我觉得很形象:
simonwillison.net/2023/Apr/2/calculator-for-words Think of language models like ChatGPT as a “calculator for words”
当作“搜索引擎”就不太好,反而应该尽量限制它使用 Prompt 之外的信息(当然你可能很享受自己 fact check 这个学习的过程)。主要是 hallucination 太严重了,让它原文引用点东西都是很难的事情,比如这是我拿它搜陆游的诗的结果:
> 《秋夜将晓出篱门迎凉有感》:“三万里河东入海,五千仞岳上摩天。遗民泪尽胡尘里,南望王师又一年。已是悬崖百丈冰,犹有花枝俏冒春。梦得楼台声啾啾,昨夜风雨过后天。”
>《钗头凤·世情薄》世情薄,人情恶,雨送黄昏花易落。晓风干,泪痕残,欲笺心事,独语斜阑。难,难,难!人成各,今非昨,病魂常似秋千索。角声寒,夜阑珊,怕人寻问,咽泪装欢。瞒,瞒,瞒!
> 《卜算子·咏梅》:“风雨送春归,飞雪迎春到。已是悬崖百丈冰,犹有花枝俏。”
鉴定为不如百度。