阿里云通义开源首个多模态推理模型QVQ 视觉推理比肩OpenAI o1
12月25日,阿里阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview。云通义开源首QVQ展现出超预期的个多视觉理解和推理能力,在解决数学、模态模型物理、推理科学等领域的觉推肩复杂推理问题上表现尤为突出。多项评测数据显示,理比QVQ超越了此前的阿里视觉理解模型「开源王者」Qwen2-VL,整体表现与「满血版」OpenAI o1、云通义开源首Claude3.5 Sonnet等推理模型相当。个多目前,模态模型开发者可在魔搭社区和HuggingFace平台上直接体验。推理
人类的觉推肩推理能力植根于语言思维和视觉记忆中,正因此,理比利用视觉理解增强大模型推理能力,阿里成为AI技术的前沿探索之一。一个月前,通义发布AI推理模型QwQ-32B-Preview,即斩获SuperCLUE的AI推理模型榜单「全球开源冠军」;如今,通义团队在Qwen2-VL-72B开源模型基础上,研发出多模态推理模型QVQ-72B-Preview,可实现更仔细的逐步推理,视觉推理能力也显著进步,在解决复杂问题时表现惊艳。
在考察模型视觉理解及推理的MMMU评测中,QVQ取得了70.3分,水平已达大学级别;在聚焦数学的视觉推理测试MathVista中,QVQ得分超过OpenAI o1,印证了其强大的图形推理能力;在更具多样性和学科广度的MathVison评测中,QVQ表现超越Claude3.5及GPT4o,说明QVQ更擅长解决真实数学问题;在奥赛级别的OlympiadBench基准测试中,QVQ也展现了出色的视觉推理能力。
QVQ是一个会基于视觉进行深度思考推理的大模型。QVQ不但能感知更准确的视觉内容,并据此作出更细致的分析推理,还会质疑自身假设,仔细审视其推理过程的每一步,经过深思熟虑后给出最后结论。QVQ可以轻松识别“梗图”内涵;看真实照片可合理推断出物体个数及高度等信息;在面对数学、物理、化学等各科学领域难题,QVQ能像人甚至科学家一样,给出思考过程和准确答案。
目前,QVQ-72B-Preview已在魔搭社区和HuggingFace等平台上开源,开发者可上手体验。据了解,一个月前开源的推理模型QwQ受到全球开发者热捧,一发布就登上HuggingFace模型趋势榜榜首。截至目前,通义千问Qwen的衍生模型数突破7.8万个,已超越Llama成为全球规模最大的AI模型群。
相关文章
理想祝贺零跑成立九周年:一起为家庭用户带来安全可靠的出行体验
12月26日消息,理想汽车通过官方微博发布海报,庆祝零跑汽车成立九周年,并表示希望共同为家庭用户创造安全可靠的出行体验。尽管零跑汽车官方微博尚未回应,但网友因两家公司主销的家用SUV车型价格差异,戏称2024-12-27- 11月18日讯南美记者César Luis Merlo爆料,内马尔已经与母队桑托斯达成回归协议。内马尔更新社媒,晒出自己躺床上看比赛的照片。内马尔现年32岁,他少时从巴西的桑托斯出道,2013年登陆欧2024-12-27
- 11月18日讯在欧国联5-0战胜爱尔兰后,英格兰临时主帅卡斯利也完成了自己带领三狮军团的最后一场比赛。据MEGA_SPORTS的数据统计,在临时带队的6场比赛中,卡斯利取得5胜1负的战绩,球队打进162024-12-27
- 伊森无敌了,外防抢断120内防90。全套防守勋章加投射由诠释了所有发表在NBA2KOL2 NBA2Konline2024-12-27
- 12月22日,全球首台30MW(兆瓦)级纯氢燃气轮机“木星一号”整机试验首次点火成功,这也是目前全球单机功率最大的纯氢发电机组。此次纯氢点火试验成功,验证了纯氢燃气轮机系统可靠2024-12-27
- 11月18日讯欧国联B2组第6轮,英格兰对阵爱尔兰,本场比赛,凯恩点射,安东尼-戈登和加拉格尔均取得进球。据StatMuse FC数据统计,戈登和加拉格尔本场比赛的进球是他们各自在英格兰队的首粒进球。2024-12-27
最新评论