AI 聊天机器人不断更新,除了一些常见的科技巨头外,中国的 DeepSeek 也以黑马之姿跻身顶级竞争的行列。透过最近对 R1 模型的更新,DeepSeek 将自己定位为 ChatGPT、Claude 和 Gemini 的有力竞争者。虽然在基准测试中显示其效能优越,但实际使用的表现是否真是如此?

为了找出答案,外国媒体 Tom's Guide 从推理、创意、情绪智慧、生产力建议与程式能力等 5 个面向,以相同的提示词测试了 4 个最新模型,包含 Claude 4、Gemini 2.5 Pro、ChatGPT-4o 和 DeepSeek R1,揭示每个 AI 的强项及弱项。

文章目录