8月2日,新王新超lmsys官方在推特发布一则消息,登基度更恭喜DeepMind研发的新王新超北京技校图书馆秘密录制Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。登基度更
这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的登基度更Overall ranking宝座。
Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。获得了超过12,登基度更北京技校图书馆秘密录制000个社区投票,新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧,新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更
Gemini 1.5 Pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,指令遵循排名前二,编码排名前五,硬提示(英语)排名前五。
Gemini 1.5 Pro 实验版(0801)具有强大的多语言能力,在中文、日语、德语、俄语方面均表现第一。
从总体胜率图上,也能看出Gemini 1.5 Pro 实验版 (0801)实力强劲,对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。
前OpenAI的开发者,现Google AI Studio的产物负责人Logan Kilpatrick火速转发,向大家宣布Gemini 1.5 Pro 实验版(0801)目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。
DeepMind的CEO Demis Hassabis也转发了这条消息,祝贺Gemini 1.5 Pro 实验版(0801)能够在极具竞争力的榜单中拿下第一,并且宣布这一版本的已经可以在 AI Studio上进行试用。
带领研发Gemini的Jeff Dean也随后转发,对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪,也很期待未来能看到其他更好的模型。
听闻这则消息,其他从业人员也纷纷发来祝贺。
也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程影片,并总结道,Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象,Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力,也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。
有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。
也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。
也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线,希望能够API实现Gemini 1.5 Pro的实际运用。
大家对Gemini 1.5 Pro这次发布的实验版本有什么看法,欢迎评论区留言分享~雷峰网(公众号:雷峰网)雷峰网
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
云南威信县黑龙村强降雨疑似致5人失联
从 Snapchat 离开的人
人形机器人公司 Foundation 融资 1100 万美元;OpenAI 聘请前 Meta 高管领导战略计划丨AI情报局
转发有奖|AFAC2024 金融智能创新大赛,持续火热招募中!
蓝振忠也发「英雄帖」,中国版 ChatGPT 明星公司寻找 CEO
李飞飞所创 World Labs 估值或超 10 亿美元;传字节将于 19 日公布文生图/视频等 AI 模型进展丨AI情报局
从 Snapchat 离开的人
发布三个月,豆包大模型综合能力提升20.3%,应用落地再提速
“从未宣布暂停对乌军援” 美方说法又变了
李飞飞所创 World Labs 估值或超 10 亿美元;传字节将于 19 日公布文生图/视频等 AI 模型进展丨AI情报局
AI 手术平台 Caresyntax 获 1.8 亿美元融资;智元发布 5 款商用人形机器人,开发者还能“0元购”丨AI情报局
GPT未竟的革命,由o1接棒:或是LLM研究最重要的发现
多模态AI技术「涌现」,AI公司的「新机会」
AI 手术平台 Caresyntax 获 1.8 亿美元融资;智元发布 5 款商用人形机器人,开发者还能“0元购”丨AI情报局
国内首个!商汤科技发布“日日新5o”,实时多模态流式交互对标GPT
英伟达 Jim Fan:复刻NLP的成功路,用通用模型开启具身智能的GPT
老师因学生志愿未报清北解散群聊?校方通报
与大模型交手近 1500 天,智源仍在坚持原始创新
JetBrains与阿里云战略合作发布JetBrains AI Assistant:聚焦中国市场开发者,实现开发效率代际提升
百川智能完成 50 亿元 A 轮融资,北上深国资入局;OpenAI 挑战谷歌,发布 AI 搜索 SearchGPT丨AI情报局
乌克兰声称已拘留两名中国公民 外交部回应
炒菜机器人公司橡鹿科技再获京东近 2 亿元投资;袁进辉公司硅基流动新增两位联创,获哈勃智谱 AI 等入股丨AI情报局
发布三个月,豆包大模型综合能力提升20.3%,应用落地再提速
人形机器人「星尘智能」获数千万美元Pre
[list:i operate=+3]吴艳妮母亲熊艳拒绝八十万公关费:抢跑又不是抢劫
[list:i operate=+3]图灵奖遗忘的AI之父,GAI时代再发声:Jurgen重谈AI“创业”史
[list:i operate=+3]成立996天,MiniMax 每日与世界的30亿次交互
[list:i operate=+3]四个月融两轮,千寻智能获 2 亿元天使轮融资;大模型公司卓世科技获亿元人民币 B+ 轮融资;小鹏机器手首次亮相丨AI情报局
[list:i operate=+3]《姐妹不打烊》6月10日开播,“七乐美”欢乐集结,以东方之礼巡游壮阔山河!
[list:i operate=+3]亮点剧透丨大模型产业应用如何落地,WAIC 探讨技术突破与最新实践