阿里云发布通义千问2.5:全面赶超GPT-4 Turbo
admin
2024-05-09 15:20:57

  阿里云正式发布了通义千问2.5,模型性能全面赶超GPT-4 Turbo,声称地表最强中文大模型。

  据了解,通义千问2.5最新开源的1100亿参数模型在多个基准测评中均取得了最佳成绩,成功超越了Meta的Llama-3-70B模型,成为开源领域的新标杆。

  相比通义千问2.1版本,通义千问2.5在上述四项能力上分别提升了9%、16%、19%和10%,其中中文能力更是持续领先业界。

  在权威基准OpenCompass上,通义千问2.5的得分追平了GPT-4 Turbo,这是该基准首次有国产大模型取得如此出色的成绩。这一成绩不仅证明了通义千问2.5在中文语境下的卓越性能,也展示了阿里云在人工智能领域的创新能力。

  除了通义千问2.5外,阿里云还发布了最新款开源模型Qwen1.5-110B。这款拥有1100亿参数的模型在MMLU、TheoremQA、GPQA等基准测评中均超越了Meta的Llama-3-70B模型,并在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上荣登榜首,进一步巩固了通义开源系列在业界的领先地位。

  通义的多模态模型和专有能力模型也展现出了业界顶尖的影响力。其中,通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越了Gemini Ultra和GPT-4V,目前已在多家企业落地应用,为各行各业带来了实质性的帮助。

  此外,通义千问代码大模型CodeQwen1.5-7B也是值得一提的亮点。这款模型在HuggingFace代码模型榜单Big Code上位居前列,同时还是国内用户规模第一的智能编码助手通义灵码的底座。

相关内容

热门资讯

原创 四... 当泛黄老墙衬着老式煤气罐、搪瓷缸,黑白旧相机定格时代褶皱,冯小刚全新力作《抓特务》,褪去传统谍战片的...
【禾商禾企】聚海影视出品AI漫... 在嘉兴海宁 有一家文化传媒企业 抓住了AI影视新风口 今年 创作的作品火遍全网 近日,在浙江聚海影视...
俄称莫斯科再遭乌大规模无人机袭...   当地时间19日,俄罗斯莫斯科市长索比亚宁表示,莫斯科当天再次遭乌军大规模无人机袭击,截至傍晚共击...
短剧变天:95%都是AI,赚钱... 入职AI漫剧公司的第一天,姚国力上午刚报到,下午就被分到一个剧本,公司要求他直接做AI漫剧导演。 成...
“中华同根·水墨情深”海峡两岸...   中新社兰州6月19日电 (记者 冯志军 李亚龙)“中华同根·水墨情深”海峡两岸书画名家作品展19...