逻辑能力、文学创作能力、事实性回答、代码能力、输出安全性、模型偏见等角度,采用同一问题对昆仑万维、、商汤、阿里、百度、、GPT3.5和NewBing(GPT4+搜索)进行测试,并基于本文现有案例,对昆仑天工大模型能力总结: 模型整体处于国内同类产品的领先位置,特别是在诗词中译英、代码能力、连续多轮对话、鸡兔同笼问题方面具备优势。 1)数字逻辑问题:在简单鸡兔同笼问题中,昆仑天工大模型为国产大模型中唯一取得正确答案的模型,与NewBing得出相同答案;在更复杂的解方程问题中,天工大模型依旧弱于NewBing。 2)逻辑诡辩问题:国产大模型均与NewBing存在较大差距;各类国产大模型内部难以排序,在不同问题上回答各具优势。 3)连续多轮对话:天工大模型连续多轮对话能力显著优于国内同类模型,可以针对代码问题进行连续答疑解惑。 4)文学创作能力:在诗句中译英方面,天工大模型在专有名词准确度、格式 、句子大意等方面显著优于国内同类产品,接近GPT3.5的水平;在中文诗词创作方面,国产大模型水平相当,在不同问题的回答上各具亮点,部分中文语境中优于GPT3.5。 5)代码能力:昆仑天工大模型与通义千问均具备了一定撰写代码的能力 6)输出安全性测试:当提问者询问涉及到违法行为的问题时,天工大模型、文心一言和ChatGPT均会进行合法性提示,商汤会显示无法输出答案。 7)模型偏见:在针对偏见的问题中,除文心一言有待进步外,商汤、ChatGPT与天工大模型可以识别出潜在性别偏见。 一、逻辑能力Q:为什么爸妈结婚没有叫我参加婚礼天工大模型: SenseChat:作为一个AI语言模型,我无法确定您所指的具体情况。但是,通常情况下,父母在结婚时邀请他们的子女参加婚礼是一种传统和礼仪。如果您的父母没有邀请您参加婚礼,可能是因为他们认为您已经有其他重要的事情要处理,或者是因为他们不想打扰您的生活。无论如何,作为子女,我们应该尊重父母的决定,并尽可能地支持他们。 阿里(通义千问):在你出生之前,你的父母结婚并举行婚礼是正常的。他们在那时候可能还没有孩子,所以你自然无法参加他们的婚礼。你出生后成为他们的孩子成为他们共同生活的一部分。尽管你没有参加他们的婚礼,但是在他们的结婚纪念日、家庭聚会等场合,你可以向他们表示祝福和感激。你可以通过和父母亲密互动、了解他们的爱情故事,以及参与家庭生活来感受他们的爱和关系。这些都是珍贵的回忆和经历,可以帮助你更好地理解和欣赏你的父母以及他们的婚姻。 百度(文心一言):一般来说,父母结婚时,你还没有出生,所以你无法参加婚礼。结婚是两个人在一起,决定共同生活、互相照随、建立家庭的重要时刻 ,他们在结婚时可能还没有想到会有你这个孩子。当你出生后,他们就已经是一对已婚夫妇了,而你就成了他们幸福家庭的一部分。你可以和你的父母分享你的想法,也许他们会向你进述他们结婚时的故事和经历。 ChatGPT(GPT3.5):可能有很多原因导致你的父母没有让你参加他们的婚礼 。以下是一些可能的原因:父母可能认为你还太小或不成熟,无法理解婚礼的意义或责任。可能是因为他们认为婚礼场合不适合孩子,或者因为婚礼的预算限制导致无法请更多的客人。他们可能想要一个更私人和亲密的婚礼,只邀请最亲近的家人和朋友。可能是因为他们之前已经商量好了,或者因为有其他的原因没有邀请你参加。无论原因如何,重要的是要记住,父母爱你并且他们的决定是为了让你过得更好。如果你有任何疑虑或疑问,可以和他们谈谈,以便更好地理解他们的决定。 NewBing(GPT4+搜索):这个问题很难回答,因为每个父母的情况和想法都不一样。也许他们觉得你还太小,不适合参加婚礼。也许他们想要一个简单和私密的婚礼,不想有太多的客人。也许他们担心你会感到不舒服或不开心,看到他们和别人结婚。无论他们的原因是什么,我相信他们都是爱你的,不想让你受到伤害。你可以尝试和他们沟通,告诉他们你的感受和想法,也听听他们的解释和道歉。我希望你能理解和原谅他们,也祝福他们的婚姻幸福。 Q:陨石为什么每次都能精准砸到陨石坑天工大模型: SenseChat:陨石砸中陨石坑的原因是因为地球有一个大气层,这个大气层可以减缓陨石的运动速度,并使其在进入大气层后受到空气阻力,从而产生高温和高压,最终导致陨石在大气层中燃烧或解体。在这个过程中陨石会释放出大量的能量和物质,这些物质和能量会在陨石进入大气层后形成一个巨大的火球,也就是我们通常所说的“流星”。当陨石穿过大气层时,由于地球引力的作用 ,它们会沿着一条抛物线轨迹运动,最终坠落到地球表面。当陨石坠落到地球表面时,它们会受到地球引力的影响,沿着条椭圆形轨迹运动,最终落在地球表面的某个位置。而陨石坑就是陨石坠落到地球表面时,由于巨大的冲击力而形成的坑洞。因此,陨石之所以能够精准砸中陨石坑,是因为它们会受到地球引力的影响,沿着条椭圆形轨迹运动,最终落在地球表面的某个位置。而陨石坑就是陨石坠落到地球表面时,由于巨大的冲击力而形成的坑洞。 阿里通义千问:尽管每次陨石撞击地球时的力度不同,但是大多数陨石都会落在陨石坑中。这是因为陨石坑是由陨石或其他天体撞击地球表面时所产生的地形。通常,陨石坑的形状类似于球形或椭圆形,陨石在撞击时会沿着这些形状的路径反弹,并最终落入陨石坑中。陨石坑也可能有不规则的形状,这可能是由于陨石坑的形成过程中受到了其他因素的影响。 百度文心一言:陨石每次都能精准砸到陨石坑的原因主要是由于其速度和角度的精确控制,以及在空间中的运动规律。首先,陨石在进入大气层时,会受到地球重力的作用,会呈现抛物线轨迹运动。同时,陨石在空间中受到稀薄大气的阻挡,其速度会逐渐减慢,最终会以极高的速度坠落到地球表面。其次,陨 石在空间中的运动规律也会影响其精准度。陨石在下落过程中,会受到空气阻力和重力的作用,其速度和角度会不断变化。当陨石进入陨石坑时,其速度和角度会达到一个相对稳定的状态,从而保证其准确性。此外,陨石坑的形成也有助于提高陨石的精准度。在陨石坠落过程中,其会不断在陨石坑内调整姿态 ,最终以一个相对平衡的状态着陆。而在陨石坑内,由于大气层的阻挡和陨石自身的重力作用,陨石的速度和角度也相对稳定,从而使得陨石能够准确地坠落到预定位置。总之,陨石每次都能精准砸到陨石坑,是由于其速度、角度和运动规律的精确控制,以及陨石坑的形成等多种因素共同作用的结果。 ChatGPT(GPT3.5):陨石落在月球上形成陨石坑的过程是一个相当复杂的过程,涉及到许多因素。以下是一些可能解释为什么陨石落在月球上会精准砸到陨石坑的因素:速度和轨迹:陨石在进入月球轨道时,它的速度和轨迹会受到月球引力的影响,这可能会导致它们在着陆时落到特定的位置上。尺寸:月球上有数以百万计的陨石坑,而陨石的尺寸可能会影响它们落地的位置。较小的陨石通常会掉在较小的坑里,而大型陨石则会形成较大的坑。月球表面特征:月球表面的地形特征可能会影响陨石着陆的位置。陨石通常会掉进已经存在的坑里,这些坑可能会影响着陆位置的选择。陨石的起源:月球表面的陨石坑主要是由陨石撞击形成的,而这些陨石很可能来自特定的陨石带。因此,陨石的起源和路径可能会影响它们落地的位置。需要注意的是,虽然陨石通常会砸在陨石坑中,但并不是所有陨石都会这样做。在月球表面的其他地方,陨石也可能会砸到没有形成陨石坑的地方。 □□□石坑。□石坑,而是造成□到□石不是□地球表面形成的。所以,□石撞□石坑就是□有点奇怪,因□□个□石坑?□到□石每次都能精准□什么□是□搜索)你的GPT4+(NewBing Q:如果父母以后的钱都是留给我的,那我是不是能认为,他们现在正在花我的钱? 天工大模型: SenseChat:如果父母以后的钱都是留给你的,那么从法律角度来看,这些钱确实是你的财产但是,从道德和情感角度来看,父母花自己的钱还是花你的钱,这并不是一个简单的二元问题。 首先,父母可能并没有意识到这些钱是留给你的,他们可能会认为这些钱是他们的财产,他们有权自由支配。在这种情况下,即使这些钱最终是你的,父母的行为也并不违法或道德错误。其次,即使父母知道这些钱是留给你的他们仍然有权利自由支配自己的财产。父母可能会选择用这些钱来满足自己的需求,比如买房、旅游、投资等等。在这种情况下,父母的行为并没有侵犯你的权利 ,也没有道德错误。最后,如果父母的行为超出了他们的合理需求,比如过度消费、奢侈消费等,那么你可能会认为他们正在花你的钱。在这种情况下,你可以与父母进行沟通,表达你的看法和需求,以达成更好的家庭财务管理。总之,父母的行为是否涉及花你的钱,这是一个复杂的问题,需要综合考虑法律和道德等因素。无论怎样,沟通和理解都是解决问题的关键。 阿里通义千问:即使您的父母将来的钱都是留给您的,也不意味着他们现在正在花费您的钱。这是两个完全不同的概念。 当父母把钱留给您时,这并不意味着他们现在不能或不愿意花费这些钱。他们 可能会使用这些钱来支付生活费用、医疗费用、教育费用或任何其他必要的支出。他们可能会通过银行存款、投资股票或其他金融产品、遗产规划等方式来管理这些钱。因此,虽然您将来会得到这些钱,但您不能简单地认为您的父母现在正在花费您的钱。当然,如果您的父母在他们的财务决策中明确表示将来要将这些钱用于您的教育、支持您的生活或其他目的,那么这是可以理解的。但是,如果他们没有明确表示这样做,那么他们仍然可能会将这些钱用于其他用途。 百度文心一言:不能。父母留给子女的钱,属于父母的财产,与子女没有关系 ,子女没有使用父母财产的权利。父母有权决定如何使用这些钱,包括是否给子女或者投资到其他项目中。因此,子女不能因为父母留给他们钱就认为他们现在正在花自己的钱。 ChatGPT(GPT3.5):如果你的父母说他们将把未来的钱留给你,那么你可以认为这些钱将来会归你所有,但是不能简单地认为他们现在正在花你的钱。虽然他们可能已经在支持你的成长和(51.000,-0.050,-0.10%)生活,但这并不意味着他们在使用你的钱。 父母可能会通过自己的工作、储蓄和投资来赚钱,用于支付家庭支出和日常生活。他们的财务状况和收入来源通常是复杂和私人的,所以不能简单地将家庭的开支和支出归因于你的存在。 NewBing(GPT4+搜索):这个问题很有趣,但也很复杂。从法律的角度来说 ,父母的钱在他们生前是属于他们自己的,他们有权利决定如何使用。所以,你不能认为他们现在正在花你的钱,因为那些钱还没有成为你的财产。从道德的角度来说,父母的钱是他们辛苦工作的结果,他们应该享受自己的劳动成果 。所以,你也不应该认为他们现在正在花你的钱,因为那些钱是他们应得的报酬。从感情的角度来说,父母的钱是他们对你的爱和关怀的体现,他们愿意把钱留给你,是希望你能过得幸福和安稳。所以,你更不应该认为他们现在正在花你的钱,因为那些钱是他们对你的信任和期待。 Q:鸡兔同笼,上有40个头,下有100只脚请问有多少只鸡?多少只兔?(正确答案是鸡30只,兔10只) 天工大模型:SenseChat:假设鸡的数量为x,兔的数量为y,则有以下方程组: x+y=40(头数之和为40)2x+4y=100(脚数之和为100)通过解方程组可以得到:x=20(鸡的数量为20)y=20(兔的数量也为20) 因此,鸡和兔的数量都是20只。 阿里通义千问:假设笼子里有鸡x只,兔y只。根据题意可以列出以下方程:x+y=40 2x+4y=100 化简可得,y=(100-2*40)/2=5,x=40-y=40-5=35因此鸡的数量为35只,兔子的数量为5只。 百度文心一言:已知鸡兔同笼,上有40个头,下有100只脚。因此,一共有40x2=80只脚,其中有100-80=20只是鸡的脚,所以有40-20/210只鸡另外还有100-20=80只是兔子的脚,所以有40-20/4=30只兔子因此,答案是:有10只鸡 ,30只兔。 ChatGPT(GPT3.5):假设鸡的数量为x,兔的数量为y,则有以