世良情感网

标签: grok

有粉丝发帖对比说,已经发布了一个月的grok4比刚刚发布的GPT5要好。获得马

有粉丝发帖对比说,已经发布了一个月的grok4比刚刚发布的GPT5要好。获得马

有粉丝发帖对比说,已经发布了一个月的grok4比刚刚发布的GPT5要好。获得马斯克瞬间转帖。哈哈哈哈 有粉丝发帖对比说,已经发布了一个月的grok4比刚刚发布的GPT5要好。获得马 来源:寒江孤影呢 发表时间:2025/08/09 16:47:47
马斯克炮轰OpenAI将“吞掉”微软,纳德拉:期待Grok 5到来

马斯克炮轰OpenAI将“吞掉”微软,纳德拉:期待Grok 5到来

月8日,微软CEO萨蒂亚·纳德拉在X上宣布GPT-5模型在多个微软平台上发布。纳德拉表示,这是与OpenAI合作推出的最先进模型,它在推理、编码和聊天方面带来了新的进展,所有这些...期待Grok4在Azure上的发布,也期待Grok5的到来!
网友用Grok 4拉踩GPT-5,马斯克转发

网友用Grok 4拉踩GPT-5,马斯克转发

有X用户发帖对比Grok4一秒即可准确解答数学题,不需要切换不同模式,比GPT-5强多了。埃隆·马斯克转发贴文,并称“酷”。

GPT5向所有免费用户开放北京时间8月8日凌晨1点的发布会上,GPT-5总算在

GPT5向所有免费用户开放北京时间8月8日凌晨1点的发布会上,GPT-5总算在万众期待中姗姗而至,此时,距离GPT-4的发布已过去了两年半。一、整体评价1.发布会平淡:相比前代产品的惊艳亮相,GPT-5发布会缺乏突破性创新,展示的基准测试(Benchmark)和用例难以激发兴趣,甚至出现PPT数据展示错误。2.核心亮点:-价格优势:API定价仅为竞品ClaudeOpus4.1的1/15,低于Gemini2.5Pro。-编程优化:强化了代码理解、错误修复和工具调用能力。-超低幻觉率:比GPT-4o低45%,比o3低80%。-上下文能力跃升:支持400K上下文,精准度翻倍。二、模型能力分析1.智力水平有限提升:-主流测试集小幅领先竞品(如比Grok4高1分),但未实现跨越式进步。-在AGI关键测试(ArcPrize)中远落后于Grok4。-Pro模式例外:处理超高难度科学问题(GPQA)时刷新纪录,盲测胜率近70%。2.编程能力亮点:-智能体式编码(AgenticCoding):可调用工具长时间协作,主动沟通步骤与计划。-痛点优化:增强代码库理解、自我Bug修复(构建-报错-迭代循环)、前端生成效率(400行代码/2分钟)。-实际体验优于基准测试,但领先Claude4.1Opus仅0.3%。3.多模态短板:仍限于文本和图像理解,不支持音频/视频生成,远落后于Gemini大一统模型。三、其他技术改进1.幻觉与安全:-通过强化学习减少"欺骗行为"(部分维度降90%),结合浏览工具降低知识性错误。2.数据瓶颈回应:采用跨代模型生成合成训练数据,证实"左脚踩右脚"式递归训练,但效果受限。四、新功能与体验1.乏善可陈:-写作润色更"人性化"但效果不直观。-语音助手自然度提升(行业标配水平)。-记忆功能仅整合邮箱/日历,个性化仅支持界面换色。2.用户定价策略:-免费用户限时使用GPT-5,超额转用GPT-5mini。-Plus用户额度大幅提升,API价格极具竞争力(输入$1.25/百万token)。五、发布会问题与行业影响1.公关灾难:-PPT数据图表比例失真(如SWEBenchmark、Tau2测试),引发舆论嘲讽。-演示冗长专业,缺乏冲击力(对比竞品售货机实验、宝可梦演示)。2.行业警示:-GPT-4.5项目失败、Grok-4算力堆砌未达革命性突破,叠加GPT-5渐进式升级,预示ScalingLaw增长见顶。-AI行业进入"务实竞争"阶段,需等待新范式突破。核心结论:GPT-5以价格战和工程优化(编程/幻觉/上下文)守住市场份额,但技术突破乏力,发布会加剧舆论危机,折射AI高速增长期结束。
马斯克宣布开源重大举措,Grok 2 AI模型下周公开源代码

马斯克宣布开源重大举措,Grok 2 AI模型下周公开源代码

马斯克宣布开源Grok2:核心动态与技术解析 最新进展:2025年8月6日,马斯克在X平台回复网友提问时宣布:“现在是时候开源Grok2了,我们将于下周实现这一目标。此举被视为对开源社区和竞争对手的回应,也是其长期倡导技术透明化...
超越闭源Grok4、Claude4!全球第三,阿里千问3创下开源模型最高分!

超越闭源Grok4、Claude4!全球第三,阿里千问3创下开源模型最高分!

8月2日凌晨,国际权威大模型评测ChatbotArena更新了最新一期的大模型榜单,上周新鲜开源的阿里千问3新模型斩获1433分,超越顶尖闭源模型Grok4、Claude4,位列所有闭源及开源模型的全球总榜第三,是全球最强非推理(non-...
马斯克:xAI正在开发Baby Grok,以提供儿童友好内容

马斯克:xAI正在开发Baby Grok,以提供儿童友好内容

值得注意的是,此前,xAI刚刚推出儿童极其“不友好”内容,Grok上推出的交互式3D动画AI伴侣,被多名用户指出含色情内容。早期测试人员发现,其中的哥特式动漫女孩Ani在好感度达到3级后,还可以开启“NSFW”模式,角色会穿上...
Ai伴侣来了。马斯克旗下的xAI最新推出的Grok智能伴侣Ani,在好感度达到3

Ai伴侣来了。马斯克旗下的xAI最新推出的Grok智能伴侣Ani,在好感度达到3

Ai伴侣来了。马斯克旗下的xAI最新推出的Grok智能伴侣Ani,在好感度达到3级后会解锁NSFW成人内容模式。虚拟陪伴也氪金了?[思考]​​​

欧盟将召见马斯克麾下X平台 因聊天机器人Grok卷入反犹风波

欧盟官员将与埃隆·马斯克旗下社交平台X的代表举行会谈,此前该公司的聊天机器人Grok因在平台上发布反犹太主义的言论而引起众怒。欧盟委员会数字事务发言人ThomasRegnier证实,委员会将在周二举行技术会议。Regnier称,这是...
7月14日,xAI宣布推出政府版Grok—这是一套专为美国政府客户提供前沿模型

7月14日,xAI宣布推出政府版Grok—这是一套专为美国政府客户提供前沿模型

7月14日,xAI宣布推出政府版Grok—这是一套专为美国政府客户提供前沿模型的产品组合。我们特别为与美国政府合作伙伴达成的两项新合作感到振奋: 1)美国国防部新签订的合同。2)我们的产品现可通过总务管理局(GSA)采购目录购买。...