解析 DeepSeek 开源大模型:开放程度与使用限制

AI资讯2个月前发布 xiaotongyan
1.7K 0

开源大模型 DeepSeek 引起了全球广泛关注,被誉为“开源的胜利”。本文将详细解析 DeepSeek 的开源策略及其开放程度,并探讨其使用和分发时需遵守的条件。

DeepSeek 是一款性能卓越的开源大模型,其多个版本(如 V2、V2.5、V3、R1-Zero、R1)展示了强大的竞争力。特别是 V3 和 R1 版本,分别在多个基准测试中表现出色,甚至超越了一些闭源模型。然而,DeepSeek 的开源并非完全彻底,其开放层级尚未达到最高级别。

DeepSeek 的开源许可证

DeepSeek 在 Hugging Face 上开放了 68 个模型及一个数据集。其中,R1 和 R1-Zero 模型采用了 MIT 许可证,而其他模型则使用了 DeepSeek 许可证。代码部分则统一采用 MIT 许可证。此外,DeepSeek 还基于 Qwen 和 Llama 模型蒸馏了 6 个模型,这些蒸馏模型同样遵循 MIT 许可证,但其基础模型分别采用 Apache 2.0 和 Llama 许可证。

DeepSeek 的开放层级

根据 LF AI&Data 基金会的模型开放框架,大模型的开放分为三个层次。DeepSeek 开放了模型架构、模型卡、模型参数、技术报告和评估结果等内容,因此其开放层级达到了第三级。然而,DeepSeek 尚未开放训练代码、推理代码、评估代码和数据集等关键组件。

使用和分发 DeepSeek 模型的限制

除 R1 系列模型外,其他 DeepSeek 模型均采用 DeepSeek 许可证。该许可证基于负责任的人工智能许可证(RAIL),并加入了一些使用限制,如禁止用于军事用途、生成虚假信息等。值得注意的是,大多数限制条款实际上已在现代法律中明确规定。此外,DeepSeek 授予了版权和专利许可,允许用户在遵守条件下自由使用、修改和分发模型。

分发和再分发的条件

如果要将 DeepSeek 模型托管、复制或分发给第三方,分发者必须确保遵守以下条件:将使用限制纳入法律协议中,提供 DeepSeek 许可证副本,标注修改声明,保留版权声明,并遵守其他附加条款。若未满足这些条件,分发者可能面临违约或侵权风险。

蒸馏模型的额外限制

DeepSeek 的蒸馏模型不仅需遵循自身的 MIT 许可证,还需遵守基础模型的许可证要求。例如,基于 Llama 模型的蒸馏模型必须在分发时附带 Llama 许可证副本,并在相关页面突出显示“使用 Llama 构建”。此外,还需在模型名称前加上“Llama”,并在声明文件中保留版权归属。

DeepSeek 是否完全遵守开源许可证

尽管 DeepSeek 表现优异,但在某些方面并未完全遵守开源许可证。例如,未在分发材料中附带 Llama 许可证副本,未突出显示“使用 Llama 构建”,也未保留必要的署名声明。尽管如此,DeepSeek 的出现依然为开源大模型带来了新的希望,推动了负责任的人工智能发展。

总结

尽管 DeepSeek 存在一些未完全遵守开源许可证的情况,但这并不妨碍它成为开源大模型领域的佼佼者。开发者在使用和分发 DeepSeek 模型时,应严格遵守许可证规定,构建更加透明和负责任的人工智能生态系统。

© 版权声明

相关文章

暂无评论

none
暂无评论...