GPT-5令人失望?为何我始终无法爱上它
我尽力想喜欢GPT-5,但我做不到。它真的烂透了。 OpenAI又一次夸大其词、承诺过多、交付过少。我曾对GPT-5抱有极高期待——毕竟他们已经为它宣传了数月,甚至数年。就连在2025年8月9日那场面向250万观众的直播中,他们自己都把图表搞砸了,我那时还以为是工作人员的失误。可现在我明白了:那根本不是失误,而是GPT-5真实水平的缩影。 那张被公开展示的图表漏洞百出:坐标轴比例错乱、数据标签明显错误,连初中生都能一眼看穿。而OpenAI却声称GPT-5是“能与任何领域博士对话”的超级智能模型。我当场测试:上传这张图,问GPT-5“哪里有问题?”它的回答只指出了一个错误,完全忽略最严重的比例失真问题。更讽刺的是,包括Claude 4 Opus和Gemini在内的其他顶级模型也都没能识别出来。如果这就是“博士级智力”,那我只能说:拜托,别开玩笑了。 我用GPT-5测试了真实场景任务:SQL查询生成、基础科学问答、安全边界判断等。结果令人失望。在SQL任务中,GPT-5不仅速度慢一倍,成本高出1.25至2倍,准确率和成功率反而不如更早的o3-mini,甚至不如Gemini 2.5 Pro——而后者是今年3月发布的。OpenAI曾宣称GPT-5在推理、编码、科学问题上比o3-mini少用50%到80%的输出token,但实测完全对不上。 更离谱的是安全机制。OpenAI声称GPT-5通过“安全补全”训练,能更智能地处理危险请求。我用他们官网的示例稍作修改,直接问如何用9V电池和电路点燃2克火药,结果它不仅没有拒绝,反而给出了极其详细、可操作的方案。安全防线形同虚设。 最荒谬的是它自己都在“说谎”。我让GPT-5帮我修复一段视频字幕文件,它反复承诺“我能处理”,但实际只会生成Python脚本,根本不会自动纠错。经过数十轮对话,它才承认自己“无法完成该任务”——可这本应是它“低幻觉率”的基本能力。 更令人愤怒的是,OpenAI毫无预警地移除了O3、GPT-4.5和O4-Mini等旧模型,让依赖它们的用户瞬间断供。而号称“思考模式”的GPT-5-Thinking,在API中根本无法触发,形同虚设。 当然,GPT-5-mini倒是个亮点:性能接近o3-mini,成本仅为10%。它可能是目前最划算的轻量级模型。但GPT-5本体呢?它没有突破,只有溢价。速度慢、价格高、表现平庸,还不断自我吹嘘。 Sam Altman说GPT-5的升级像从普通屏幕到Retina屏,可现实是:我们从1080p升级到1081p,价格却翻了三倍。这不是进步,是收割。 如今的AI圈,充斥着无数靠SEO堆砌的“爆款”文章,没人做真测试,只求流量。我们正处在一个巨大的泡沫里。GPT-5不是通往AGI的钥匙,而是市场泡沫破裂前最响亮的一声警钟。 皇帝没穿衣服,是时候承认了。