ChatGPT 讯飞星火 BingAI HuggingChat编程能力比较

日期:2023-04-30 17:15:51 来源:哔哩哔哩

评分标准:

一、中文支持度(10分)

二、对话轮数(仅计算发送题目后的,次数越多分数越低,满分10分)


(相关资料图)

三、代码(语言正确10分,编译成功10分,洛谷测评通过10分)

那么,现在开始吧!

首先,告诉几个AI他们的任务

不难看出,除HuggingChat外,其他AI都能流畅的使用中文来回答问题(10分)

HuggingChat需要发送“please answer me in chinese”的指令(0分)

完成后,分别向AI发送编程题目,这里选择的是P1775 石子合并(弱化版)

发送后,除Bing外,其他AI均在下一轮对话中发送了代码(10分)

而Bing回答了:

在明确指出需要提供一个代码后,Bing才开始编写代码(0分)

最后,让我们来看看各家AI的输出结果

ChatGPT:

洛谷评测结果:

ChatGPT还描述了解决此题的算法,时间复杂度及具体思路,这点是值得加分的

(语言正确10分,编译通过10分,洛谷评测10分,共计30分)

Bing AI:

BingAI在输出到一半时歇菜了,直接表示自己不能回答(0分)

讯飞星火

讯飞这边使用了python来解决,而我明确提出请使用C++

洛谷评测结果:

(语言错误0分,编译通过10分,洛谷评测0分)

HuggingChat:

HuggingChat虽然使用了C++,但语法不正确,编译未通过

(使用语言正确10分,编译未通过0分,洛谷评测0分,总计10分)

最后,我们来总结一下各个AI的表现:

ChatGPT稳定发挥,取得满分50分

讯飞星火在理解和上下文衔接方面有所欠缺,取得30分

BingAI在代码编写上有所欠缺,废话略多,取得10分

HuggingChat在代码编写和中文支持上有所欠缺,取得20分

标签:

上一篇:每日快播:孙敬华

下一篇:最后一页

品牌展会
全国巡演