5月27日,蚂蚁模态在蚂蚁工艺日上,集团蚂蚁集团旗下的官宣南京高中曝光攻略百灵大模型(Ling)团队宣布正式开源统一多模态大模型Ming-lite-omni。据蚂蚁方面介绍,开源这是统多一款基于Ling-lite构建的MoE架构的全模态模型,其总参数22B,大模激活参数3B。蚂蚁模态
据悉,Ming-lite-omni当前模型权重和推理代码已开源,官宣后续会陆续开源训练代码和训练信息。开源
https://huggingface.co/inclusionAI/Ming-Lite-Omni
今年以来,统多百灵大模型已经连续开源了多个模型产物,大模包括2个MoE架构的蚂蚁模态南京高中曝光攻略大语言模型,Ling-lite和Ling-plus,集团多模态大模型Ming-lite-uni,官宣以及Ming-lite-omni-preview。
其中,其中五月中旬开源了Ling-lite-1.5,据百灵方面介绍,“能力已经接近同水位SOTA水平,介于千问4B和8B的水平。”蚂蚁方面称,这两个模型在多个算力平台(包括非Hopper架构的国产算力)进行训练,验证了300B尺寸的SOTA MoE大语言模型在非高端算力平台上训练的可行性。
而本次开源的Ming-lite-omni产物在多项理解和生成能力评测中,性能与10B量级领先的多模态大模型相当或更优。蚂蚁方面认为,这是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型。
百灵大模型负责人西亭对媒体表示,百灵大模型的命名规则是Ling代表基础大模型,Ring代表推理版本,Ming代表多模态大模型。百灵在过去主要在几个方面做了聚焦,一个是很早做MoE架构的探索,坚定的在语言大模型和多模态大模型上面统一使用了MoE的架构,同时使用了大量非高端的算力平台,证明了国产GPU的“也能训练出来可比拟GPT4o的模型”。其次,百灵很重视多模态领域的探索,一直在推进多模态的生成和理解的统一,而本次开源的Ming-lite-omin即是过去工艺探索的成果。
百灵方面表示,团队下一步将持续优化Ming-lite-omni在全模态理解和生成任务上的效果,并提升Ming-lite-omni的多模复杂推理能力;同时也会训练更大尺寸的全模态模型Ming-plus-omni。此外,根据西亭透露, 百灵还在筹备Ling的Max版本,发布节点将会是“追寻跟(deepseek)V3的版本差不多的版本时开出去”。
(雷峰网(公众号:雷峰网))
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
GAIR 2023 正式开幕:AI 如此绽放之时,昭示着熙春已至
“2025影像亚洲中国电影放映周”在布达佩斯举办
Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
莫斯科“鱼周”浪潮掀起 邀请中国游客共享美食
DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」
大模型隐藏玩家上桌:DeepSeek 向左,面壁向右
《新说唱2025》明星制作人“洗牌”登场 以年轻风暴颠覆哈圈过往
智源线虫登上Nature子刊封面,具身元年尾声深长
通用3D机器视觉平台是不是伪命题?
爱奇艺获“首届亚洲微短剧大奖”两项荣誉 精品化显成效
2025岳云鹏《非要唱》巡回演唱会北京站:用音乐讲最朴素的真心话
大阪世博会中国馆举行中国电影日活动
产业跑进数字世界,要先迈过安全这道坎
Harrison Chase:独创AI智能体「认知架构」,定制+极简加减法双驱动
央视频带您到宜春熊出没乐园解锁沉浸式童梦狂欢
《哈哈哈哈哈5》方言挑战与文化碰撞,解锁四川风情新体验
也门胡塞武装:红海受袭希腊货轮沉没
乌兰图雅放歌“金蛇献瑞 龙舞九州”全国龙舟大联动暨漳州传统龙舟邀请赛开幕式
简橙在线教育平台:王蕊瑜伽引领健康新时代,助力中老年重塑身心和谐
机器人端侧模型的十字路口
今年将举办50多场演唱会 鸟巢放歌引爆双奥场馆新热潮
央视频带您到宜春熊出没乐园解锁沉浸式童梦狂欢
实测豆包1.5后,看到了字节不走捷径的底气
《天下第一楼》600场演来如初见