Google推出的Gemini Advanced(20美元/月,含在Google One AI Premium订阅中)是目前唯一能与GPT-4o正面竞争的多模态AI助手。它最大的差异化优势是:深度整合Google全家桶。本文实测其核心能力。
多模态理解:图片分析能力
测试场景1:上传一张包含图表的商业报告截图,问”这张图表说明了什么问题?”。Gemini准确识别了图表类型(堆叠柱状图)、X/Y轴含义,并正确总结了趋势。
测试场景2:上传一张菜谱手写笔记照片(字迹潦草),要求转录成文字。识别率约85%,比GPT-4o略低,但主要内容都正确识别。
Google搜索整合:这是真正的差异化
Gemini Advanced可以在回答时联网搜索并整合最新信息,且比ChatGPT的Bing整合更流畅——Google毕竟是搜索引擎本家。
测试:问”最近一周有什么重要的AI行业新闻?”——Gemini给出了有出处链接的近期新闻摘要,且能继续追问细节。这个场景ChatGPT也能做,但Gemini的搜索质量和结果整合更好。
Gmail/Google Docs整合:实际效用有限
Gemini Advanced可以读取你的Gmail和Google Drive内容来回答问题,理论上很强大。实际体验:对简单问题(”我有没有收到XX公司的报价邮件?”)效果不错;对需要综合分析多个文档的复杂问题,准确性不稳定,有时会漏信息。
谁适合用Gemini Advanced
- 重度Google生态用户(Gmail、Google Drive、Google Docs日常使用)
- 需要频繁查询最新信息的工作(内容运营、市场研究)
- 已订阅Google One Premium的用户(Gemini Advanced免费包含在内)
如果你不在Google生态里,ChatGPT Plus(GPT-4o)仍然是功能更均衡的选择。Gemini的优势几乎全部建立在Google服务整合上。
