比官方版本还好的可定制ChatGPT

Views: 193

使用ChatGPT进行文本生成时,有时会出现模型给出的答案与现实世界不符。这种情况并不罕见,可能会让人怀疑模型的可信度和真实性。但实际上,这是由于ChatGPT中一个叫做“温度”(temperature)的参数所导致的。根据ChatGPT的解释,“温度”是控制模型输出随机性和创造性的参数。具体来说,它影响模型在生成每个单词时选择下一个单词的概率大小。较高的温度值会使模型更加随机和创造性,而较低的温度值则会使模型更加保守和可预测。因此,在使用ChatGPT进行文本生成时,可以通过调整温度值来控制生成文本的风格和多样性。如果需要更多创造性和出人意料的文本输出,可以选择更高的温度值;如果需要更符合实际场景的文本输出,可以选择较低的温度值。


可惜,这个温度的参数只能通过它的API(应用编程接口)才能修改,而在官方版本(无论是网页版本还是最近的iOS APP版本)里是无法修改的。用户为了达到预期的效果,只能不断地修改提问方式或者提问的具体词语,体验不够好,甚至根本做不到。


我们平台上的ChatGPT正是通过调用它的API来实现的(当然这个是要付费的)。所以,我们是可以在不同的场合定制不同的温度的ChatGPT机器人来实现。现在我们网站推出了三个不同类型的ChatGPT机器人(它们被定制成不同的温度),以满足大家在不同场合的需求/领域,如下表所示。付费用户在注册登录后,请找到三个不同类型的ChatGPT房间,就可以对不同的机器人提问了。如您可以问精确型机器人有关食用蘑菇的利弊;可以问平衡型机器人“假设我要给8岁的男孩做个好吃营养的晚饭,家里只有鲫鱼、豆腐、青菜、鸡蛋、洋葱,请问怎么做好?”;或者您可以问创意型机器人“我要给公司领导一个关于团队建设活动的建议,每个人预算400元,在上海当地举行,时间是在秋天的星期六,请给一个合适的建议”。

ChatGPT类型适用领域
精确型编程、数学、工程、科学等需要可预测性的领域
平衡型写作、翻译、客服、研究等基于现实的多样化和创造性的领域
创意型故事、诗歌、音乐、艺术等更创新性的和难以预测的领域
网站推出的三个不同类型的ChatGPT机器人

以下是我们做的测试。如果您想节省阅读时间,我们先直接给出如下结论。

官方网页版的ChatGPT机器人的温度大概是0.8,是不能更改的,和我们的创意型机器人很接近。所以官方网页版的ChatGPT机器人应该从来不会缺少创意,这在需要创意的回答中是合适的,比如编写小说故事、创作诗歌等。但当我们需要它严谨的时候(比如查找文献资料),它就无法做到,经常出错。为此,我们推荐用户在不同的场合使用我们三个设置了不同温度的机器人,以获得满意的答案。


为了不把大家搞糊涂了,我们直接上例子(注意:以下的例子是在私人房间测试的)。我们先使用一个试用用户在免费公开试用房间的提问来测试它们不同的回答。


提问:围绕以下词条,展开创意:假想敌 化妆包 奥特曼 四合院,并设计一款广告产品。以下截屏分别是三个机器人的回答。

如果大家花时间看了上面三个不同类型的机器人不同的回答的话,可以看出精确型的非常中规中矩,感觉是在名称解释;平衡型的有了一些创意,比如“让玩家扮演奥特曼,与各种怪兽进行战斗,保卫地球。游戏可以有多个关卡,每个关卡都有不同的难度和挑战”;而创意型确实有了更多的创意,很发散,还创造了“广告词:超级假想化妆四合院,让你的美丽与健康同时存在!”。

然后,我们看看官方网页版的机器人如何回答。

我们发现它的回答富有想象力。根据我们知道的信息和猜测,它用的温度(0.8)是与我们创意型机器人的温度很接近的。这个看起来当然不错,但是在别的场合是不是可以呢?


我们再做一个测试。提问:去新西兰旅游两个星期,怎么玩?以下截屏分别是三个机器人的回答。

如果大家熟悉新西兰,看到精确型的回答感觉像是标准答案,把新西兰最出名、最值得游览的地方基本上都涵盖到了。而且按照我的知识,没有任何错误,似乎是从哪个旅行社的广告中抄袭来的。平衡型的有了一些“不标准”了,比如提到了住当地人家里的体验生活、皇后镇的绿宝石工厂,当然也没有忘记美食(海鲜、牛肉和羊肉菜肴)。到了创意型,我们发现它的回答更有创意了,甚至创意的出了错误了。比如它提到的提珀拉克湖(常被译为特卡波湖,英文:Lake Tekapo)距离克赖斯特彻奇(Christchurch)220多公里。在首都惠灵顿附近也没有这个叫昆士敦的地方。”指环王”和“霍比特人”电影中的取景地应该是在马塔马塔(Matamata)。这些地方都不是在南岛。显然它在拼凑瞎编了。


如果您还有兴趣,可以看看我对它们另外一次同样的测试。

从上,我们再次看到精确型的回答感觉像是标准答案,又把新西兰最出名、最值得游览的地方基本上都涵盖到了,也没有任何错误。平衡型的就有些小问题了:居然把猪肉和蔬菜说成是当地美食了。我定居新西兰八年多了,每天在乡间都可以看见成群的牛羊,但我真没有看见过一个猪群啊。要吃猪肉,还是在中国吧。哈哈。至于蔬菜,我们自己家种了不少,因为是有机的,口味当然OK。但我真不觉得蔬菜也能算是新西兰的美食。当然,平衡型的也提到了羊排和草莓,这个倒是不假。此外,平衡型的比精确型的多提到了新西兰的自然保护区,这个倒是正确的“发散”回答。最后看看创意型的。真是太有“创意”了。如果你听它的,估计会先飞到澳大利亚的悉尼,然后因为没有签证被拒绝入境了,只能飞到珍珠港看美军的军舰去了,最后这两周连新西兰的影子都没看见,更不要说吃到这里美味的牛羊肉了。

最后,我们来看看官方网页版的回答。

与我们上面得到的信息和猜想一致,官方网页版的机器人设置的温度是不变的,在这里可是与我们创意型的类似。所以我们可以看到它的回答有不少创意,比如回答中提到了:“抵达基督城,参观该城市的建筑和花园,如坎特伯雷博物馆、波塔诺玛湖(Lake Pukaki)和克莱德小镇(Clyde)。还可以选择搭乘热气球或直升机游览南岛的美景”。可是恰恰是它的创意出了错误,或者说会误导游客。这里提到的波塔诺玛湖(Lake Pukaki)距离基督城(Christchurch)约300-400公里(取决于行车路线),根本不是它所说的该城市的建筑和花园。而克莱德小镇(Clyde)更是远离基督城(约450公里)。另外,它提到多个地名的中文/英文/毛利文根本对不上:塔纳卡湖(Lake Taupo)、托纳基海湾(Bay of Plenty)、塔纳卡湖徒步径(Tongariro Alpine Crossing)。连格林诺奇冰淇淋(Hokey Pokey Ice Cream)也是对不上,搞得我都一头雾水,更不要说是国外游客了。


综上,我们的结论是:官方网页版的ChatGPT机器人的温度大概是0.8,是不能更改的,和我们的创意型机器人很接近。所以官方网页版的ChatGPT机器人应该从来不会缺少创意,这在需要创意的回答中是合适的,比如编写小说故事、创作诗歌等。但当我们需要它严谨的时候(比如查找文献资料),它就无法做到,坚持会出错。为此,我们推荐用户在不同的场合使用我们三个设置了不同温度的机器人,以获得满意的答案。

相关文章

One thought on “比官方版本还好的可定制ChatGPT

发表回复