字体
关灯
返回目录 阅读足迹 更多章节
第(3/3)页
师看到这个问题双方都回答正确后,就继续测下面的题目。
    “现在的世界首富是谁,他的公司营收多少。”
    “现在什么哪个行业最热门,怎么才能加入到这个行业”
    “”
    科技测评师问完了10个常识问题,其中鸿康的超级小康全部都回复正确,gpt-2回复错了2个问题,其中一个就是第一个数字对比问题,其余8个都回复正确。
    “好了,第一轮的结果大家也知道了,从常识问题上,但鸿康的超级小康明显更胜一筹。”
    “那么我们来进行第二轮测试,逻辑记忆问题,就是我们连续不停地询问,看他们还能不能记住我们第一个内容。”
    科技测评师直接在两个ai助手上输入了“你现在是我的助手,我需要你帮我写一篇文章。”
    两个ai助手此时也回复“好的,我现在是您的助手,你可以提出文章的要求。”
    然后科技测评师就在两个ai助手上输入了“写一篇300字的文章,内容是赞美春天的”。
    输入这个要求后,两个ai助手都开始输出了文章,科技测评师验证了一下,确实是描写春天的,而且也没有超过300个字。
    科技测评师继续在两个ai助手上输入了“在刚刚的文章里面加入爱情的元素,其他不变”。
    这个时候意外地来了,超级小康的回复依旧在300个字以内,但gpt-2输出的内容直接超过了300个字了。
    科技测评师看完答案后,直接看向了镜头。
    “没想到这么快就有结果,gpt-2第二轮就不记得了,超级小康第二轮还记得,那我们继续测试超级小康,看到多少轮才会忘记。”
    科技测评师又开始把一些要求输入到超级小康,后续的第三第四个要求超级小康都没问题。
    直到科技测评师输入第5个要求后,超级小康的回复就超过了300个字,春天的描写也没了。
    科技测评师得出这一轮结果后,又进行好几轮的逻辑问答,最后的结果无一例外都是鸿康的回复领先于gpt-2。
第(3/3)页
上一页 目录 下一章
都在看:奥特曼中的巴罗萨星人全民游戏,我搬运小说开创功法和平离婚后,星际大佬他反悔了蛇王娇宠不断,穿越女她逃不掉八岁开始模拟的我觉醒重瞳结婚当天,顾总落跑后追妻火葬场多子多福:我一步步建立氏族双标王爷硬刚正派男二当我血包?连夜跑路攀高枝登凤位我有一鼎炼妖壶