看了最新评论Grok3 beta可以正确比较出9.9>9.11,也能正确数出strawberry中r的个数,但是数字母o出错
GPT4o o1mini o3mini全对
所以个别问题上Grok3 beta并没有超越GPT4o及更高版本,但是超过GPT4o mini,估计也没超过gemini 2 flash thinking
好多在展示,9.11>9.9的,
看网上评论比较的结果,gpt-4o认为9.119.9,是错误的。gpt-o1 mini和gpt-o3 mini是正确的。Grok2错误。gemini 2 flash thinking也是正确的。
马斯克的牛吹的有点大了。美国的特斯拉都被抵制了,销量下滑
另外,那么多人用chatgpt比较干什么?chatgpt已经过时了,至少用4o啊,还有o1mini o3mini
关注数量超出限制,
请先删除部分内容再尝试