谷歌发布其最新一代的人工智能模型Gemini，全面超越GPT-4

谷歌憋了好几个月的大招、人类迄今为止最强大的AI模型——Gemini，终于发布了。

Gemini之所以令人瞩目，其中一个重要原因是它从根本上就是一个多模态模型。就像人一样，它不仅从文本中学习，还能通过视频、音频和代码进行学习。因此，这个模型天生就具备了更强大的能力，它可以像人类一样理解我们周围的世界，处理代码、文字、音频、图像和视频通通不在话下。

基准的MMLU（大规模多任务语言理解）测试是专门用于衡量AI模型在文本和图像的任务上的表现的。

谷歌CEO表示，在MMLU测试中，Gemini全面击败GPT4。对于纯文本问题，Gemini得分为90，人类专家得分为89。GPT-4得分为86；是大模型首次超过了人类专家。

对于多模态问题，Gemini得分为59，而GPT-4得分为57，也是Gemini更胜一筹。

Gemini似乎在几乎所有测试中都领先于GPT-4，虽然领先优势并不明显。

Gemini将从本周三开始为谷歌的Bard聊天机器人提供支持，我们也有机会自己体验一下了。并且Gemini将从明年开始广泛地应用于谷歌搜索引擎。

Gemini 包括三种量级：能力最强的Gemini Ultra，适用于多任务的Gemini Pro ，以及适用于特定任务和端侧的Gemini Nano。

Nano是Gemini大模型中最小的一款，但它是谷歌专门为在手机上运行而设计的，无需联网，可以直接在手机上本地和离线运行。谷歌已经把人工智能大模型竞赛的战线卷到了手机硬件上。

尽管一直以来，谷歌在人工智能领域有着深厚的基础，但其风头近来逐渐被OpenAI盖过。OpenAI去年推出的DALL-E和GPT-3.5，以及今年的GPT-4，无疑在人工智能行业掀起了巨大的波澜。

Gemini的诞生，无疑使谷歌在这场竞争中重新获得了有力地位。而谷歌美股盘前涨近3%，市场也是给出了相对积极的反馈。接下来OpenAI如何应对，我们拭目以待。

微信扫一扫或点击链接联系我