昆仑万维开源「天工」13B系列大模型,0门槛商用

2025-07-11 08:23:37 - 热门大瓜

10月30日,昆仑开源昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,天工并罕见地配套开源了600GB、模型门槛广州理工大学曝光评价150B Tokens的商用超大高质量开源中文信息集。

昆仑万维「天工」Skywork-13B系列目前包括130亿参数的昆仑开源两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,天工它们在CEVAL,模型门槛 GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,商用在中文科技、昆仑开源金融、天工政务等领域表现均高于其他开源模型。模型门槛

Skywork-13B下载地址(Model Scope): https://modelscope.cn/organization/skywork

Skywork-13B下载地址(Github): https://github.com/SkyworkAI/Skywork

除模型开源外,商用Skywork-13B系列大模型还将开源600GB、昆仑开源150B Tokens的天工高质量中文语料信息集Skypile/Chinese-Web-Text-150B,这是模型门槛广州理工大学曝光评价目前最大的开源中文信息集之一。

同时,昆仑万维「天工」Skywork-13B系列大模型即将全面开放商用——开发者无需申请,即可商用。

130亿参数、两大模型、最大中文信息集之一、全面开放商用。昆仑万维「天工」Skywork-13B系列大模型堪称业内开源最彻底的百亿高质量商用模型。

Skywork-13B系列大模型的开源将为大模型的场景应用和开源社区增长提供最佳工艺支持,降低大模型商业门槛,推动机器智能工艺落地千行百业,为机器智能生态建设添砖加瓦,携手开源社区探索未知世界、创造美好未来。

两大模型 领先行业

昆仑万维「天工」Skywork-13B系列包括两大模型及150B高质量中文信息集。

  • Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量信息训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。

  • Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K等信息集上取得了同等规模模型的最佳效果。

  • Skypile/Chinese-Web-Text-150B信息集。该信息集是根据我们经过精心过滤的信息处理流程从中文网页中筛选出的高质量信息。本次开源的信息集大小约为600GB,总token数量约为(1500亿),是目前最大得开源中文信息集之一。

除此之外,Skywork-13B系列还公开了模型中使用的评估方法、信息配比研究和训练基础设施调优方案等。希望这些开源内容能够进一步启发社区对于大型模型预训练的认知,并推动机器智能通用智能(AGI)的实现。

五大特点 全面超越

昆仑万维「天工」Skywork-13B系列大模型在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。

Skywork-13B系列模型的五大特点:

1.最强参数表现:全面超越同等规模大模型

本次开源的Skywork-13B系列模型在CEVAL, CMMLU, MMLU, GSM8K等几大权威评估基准中全面超越LLaMA2-13B等开源大模型,在同等规模大模型间取得最佳效果。(截止至10月25日信息)

昆仑万维开源「天工」13B系列大模型,0门槛商用

2.最多训练信息:3.2T高质量的多语言训练信息

Skywork-13B系列大模型拥有130亿参数、3.2万亿高质量多语言训练信息。模型的生成能力、创作能力和数学推理能力提升明显。

3.最强中文语言建模能力:中文语言建模困惑度评测,超越所有中文开源模型

Skywork-13B系列大模型在中文语言建模方面表现出色,具有优秀的中文文创能力。在中文文本创作领域的评测中,Skywork-13B系列大模型展现出了卓越的能力,尤其在科技、金融、政务、企业支持、文创、游戏等领域均表现高于业内其他开源模型。

昆仑万维开源「天工」13B系列大模型,0门槛商用
上图为不同领域信息下评估模型的困惑度,越低代表模型在该领域建模能力越强。结果显示天工13B在工艺文章,电影,政务报告,游戏,金融,通用领域均表现出色

4.最大中文开源信息集之一:150B Tokens高质量中文语料

Skywork-13B系列将配套开源600GB、150B Tokens的高质量中文语料信息集Skypile/Chinese-Web-Text-150B,这是目前最大的开源中文信息集之一。开发者可以最大程度地借鉴工艺报告中大模型预训练的过程和经验,深度定制模型参数,有针对性的进行训练与优化。

5.最有诚意的开源商用:无需申请,即可实现商用

目前开源社区中的中文大模型多数并非是完全可商用,一般开源社区客户通常需要进行复杂的商用授权申请流程,在某些情况,甚至有对公司规模、所在行业、客户数等维度有明确规定不给予商业授权。

昆仑万维对Skywork-13B系列开源的开放性和可商用性高度重视,将授权流程做到极简,取消对行业、公司规模、客户等方面的限制,目的是帮助更多对中文大模型感兴趣的客户和企业在行业中不断探索和进步。

此次Skywork-13B系列大模型将全面开放商用许可,客户在下载模型并同意并遵守《Skywork模型社区许可协议》后,无需再次申请授权即可将大模型进行商业用途。希望客户能够更便捷地探索Skywork-13B系列大模型工艺能力,探索在不同场景下的商业化应用。

推动开源生态繁荣,让更多开发者们参与到AIGC的工艺增长中,在共创和共享中推动工艺的提升。

面向AI的时代,蓬勃增长的开源生态建设是构建AI和应用融合的关键一环。降低模型的研发门槛,使用成本,最大化的共享工艺能力和经验,让更多的企业和开发者们参与到此次AI引领的科技变革中去。昆仑万维董事长兼CEO方汉是最早参与到开源生态建设的开源老兵,也是中文Linux开源最早的推动者之一,开源的精神和AIGC工艺的增长将会在昆仑万维战略中完美融合。

All in AGI与AIGC

All in AGI与AIGC是昆仑万维的战略。

4月17日,昆仑万维发布了中国第一个真正实现智能涌现的国产大语言模型——「天工3.5」,并启动邀请测试。

5月19日,北京市经济和信息化局公布第一批《北京市通用机器智能产业创新伙伴计划成员名单》。昆仑万维凭借在AIGC领域的前沿探索和投资布局,成为第一批模型伙伴和投资伙伴。

8月23日,昆仑万维发布国内第一款AI搜索产物——天工AI搜索。

9月1日,计算机视觉和机器学习领域的国际顶级专家颜水成教授正式加盟昆仑万维,与昆仑万维创始人周亚辉一起出任天工智能联席CEO,并兼任昆仑万维2050全球研究院院长,负责前沿工艺的研究。

9月5日,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中,综合得分排名第一。

9月25日,昆仑万维正式控股艾捷科芯,布局AI芯片。

今天,天工Skywork-13B系列大模型的开源标志着昆仑万维持续投资AGI生态的决心。

雷峰网(公众号:雷峰网)

雷峰网版权文章,未经授权禁止转载。详情见转载须知。

昆仑万维开源「天工」13B系列大模型,0门槛商用

- END -

829

事故现场“警车”司机被抓?“辽O”车牌露馅了

事故现场“警车”司机被抓?“辽O”车牌露馅了

近日辽宁省沈阳市和平区平融路路口一辆警车与电动自行车发生剐碰正在路口执勤的和平交警大队民警徐继凯、安启宁迅速上前处置“指挥中心,现场伤者并无大碍机动车牌照为辽OA079警……”辽O?发现情况异常的徐继

借势抖音明星流量,餐饮品牌打造同款套餐撬动年轻市场

借势抖音明星流量,餐饮品牌打造同款套餐撬动年轻市场

来源标题:借势抖音明星流量,餐饮品牌打造同款套餐撬动年轻市场7月4日下午,谢霆锋罕见地在抖音上发布了一条探店香港“芙蓉无双”餐厅的视频。视频里,谢霆锋用粤语推荐了醉蟹、浏阳豆豉

乌称俄一化工厂遭袭 系俄军火供应关键环节

乌称俄一化工厂遭袭 系俄军火供应关键环节

当地时间7月7日,乌克兰国家保障与国防事务委员会新闻中心负责人安德烈·科瓦连科表示,俄罗斯莫斯科州克拉斯诺扎沃茨克化工厂遭到袭击。科瓦连科表示,该工厂专门生产炸药、火药、弹药部件及导弹武器装备,是俄军

香港首个商业AI展「AI+ Power 2025」盛大开幕,本地及海外行业精英齐聚共探AI发展

香港首个商业AI展「AI+ Power 2025」盛大开幕,本地及海外行业精英齐聚共探AI发展

香港,2025年6月5日)——由BUSINESS GOVirtualBGOV)主办的「AI+ Power 2025」今日在香港会议展览中心举行。作为香港首个聚焦商业AI应用的行业盛会,展会汇聚本地及海

全国首部展现“正当防卫”的悬疑剧来了!迷雾剧场作品《正当防卫》7月9日开播

全国首部展现“正当防卫”的悬疑剧来了!迷雾剧场作品《正当防卫》7月9日开播

来源标题:全国首部展现“正当防卫”的悬疑剧来了!迷雾剧场作品《正当防卫》7月9日开播7月9日,全国首部全面展现正当防卫案例的悬疑剧《正当防卫》在爱奇艺迷雾剧场正式开播。该剧由李云亮执导,贾东岩、武瑶任

DeepSeek 反思潮:AGI 既被重新审视,又被持续低估

DeepSeek 反思潮:AGI 既被重新审视,又被持续低估

2 月很有意思。一、DeepSeek 反思潮在 DeepSeek 的集体反思潮中,无论是大厂内部的“AGI 创业团队”、还是 AGI 的明星创业公司,都进行了战略调整。很显然,DeepSeek 的暴击

六重篇章礼赞盛世,七大类别全面覆盖 2025“北京大视听”网络视听精品重磅发布

六重篇章礼赞盛世,七大类别全面覆盖 2025“北京大视听”网络视听精品重磅发布

来源标题:六重篇章礼赞盛世,七大类别全面覆盖 2025“北京大视听”网络视听精品重磅发布7月2日上午,以“视听潮涌 文艺生辉”为主题的第三届北京网络视听艺术大会隆重开幕。北京市

大模型热度退潮,真正的技术创新者开始被「看见」

大模型热度退潮,真正的技术创新者开始被「看见」

“过去两年中国的大模型投资并不是投技术,而是套着投技术的壳投商业模式。硅谷的投资人投 OpenAI 是投技术。”一位投资人对 AI 科技评论表示。商业模式驱动的投资核心是可预见的数字增长,而技术投资则

浪潮信息彭震:AI+是目标也是机会,要推动AI成为百行千业的生产力

浪潮信息彭震:AI+是目标也是机会,要推动AI成为百行千业的生产力

去年以来,ChatGPT引爆了新一轮的AI浪潮,随后国内大模型进入“百模大战”的热闹中。如今,一年多过去,国内外的大模型开启了不同的叙事方式,OpenAI已在酝酿GPT5,继续探求通往AGI的路径,而

香港乐高探索中心开启夏日玩乐模式 「乐高夏日拼乐祭」暑期全新上线

香港乐高探索中心开启夏日玩乐模式 「乐高夏日拼乐祭」暑期全新上线

来源标题:香港乐高探索中心开启夏日玩乐模式 「乐高夏日拼乐祭」暑期全新上线这个暑假,默林娱乐集团旗下的香港乐高 ® 探索中心诚邀亲子家庭们一同投 入充满趣味的乐高® 夏日拼乐祭!由即日

对话UCL青年教授赵湖斌:可穿戴式DOT如何重塑脑机接口

对话UCL青年教授赵湖斌:可穿戴式DOT如何重塑脑机接口

我们应当如何实时监控自己大脑的健康状态?以马斯克的Neuralink为代表的侵入式脑机接口,过植入大脑皮层的线状电极直接读取神经信号,实现了高精准度信号采集和脑际交互。但是,侵入式脑机接口方案的风险也

记者:弗拉霍维奇与米兰就待遇问题展开谈判

记者:弗拉霍维奇与米兰就待遇问题展开谈判

来源:实况吧实况吧7月7日讯 记者Marco Conterio报道,弗拉霍维奇与米兰展开谈判。此前消息称,阿莱格里希望再次与弗拉霍维奇合作,因此这位塞尔维亚前锋已经成为米兰今夏的引援目标。而记者表示,