2025-08-06 04:15:36
loading...

OpenAI发布GPT-OSS-120B与20B开源模型,本地运行性能媲美商业产品

摘要
OpenAI推出gpt-oss-120b与gpt-oss-20b两款开源语言模型,可在消费级硬件上实现接近商业产品的推理性能。1200亿参数版本需80GB GPU,200亿参数版本仅需16GB内存,均支持长达12.8万token上下文,且通过强化学习与高算力RL训练优化。模型在Codeforces、AIME数学竞赛及HealthBench等基准测试中表现优异,安全性经多轮对抗评估验证。
OpenAI周二正式发布两款全新开源语言模型——gpt-oss-120b与gpt-oss-20b,标志着自GPT-2以来首次向公众开放大规模语言模型的权重。这两款模型基于Apache 2.0许可证发布,允许任何人自由使用、修改和部署,包括企业、研究机构乃至竞争对手如中国初创公司DeepSeek。这一举措在当前全球大模型竞争加剧背景下意义深远,尤其正值外界对GPT-5即将发布的高度期待之际。 H2: 消费级硬件上的高性能部署能力 gpt-oss-120b模型拥有1200亿参数,采用混合专家架构,每个token仅激活51亿参数,可在单个配备80GB显存的高端GPU(如NVIDIA A100)上运行。而更轻量的gpt-oss-20b版本则仅需16GB显存,可部署于主流消费级设备,例如售价约3000美元的NVIDIA RTX 4090显卡。两者均可处理最多128,000个token的上下文长度,与GPT-4o保持一致,具备强大的长文本理解与生成能力。 H2: 推理性能对标商业产品,多项基准测试领先 根据OpenAI官方公告,这两款模型在多个权威基准测试中表现突出。在Codeforces编程竞赛中,gpt-oss-120b使用工具时获得2622 Elo评分,不使用工具时达2463,接近甚至超越o4-mini的2719分。在AIME 2024数学竞赛中准确率达96.6%,远超o4-mini的87.3%。HealthBench医疗评估得分57.6%,高于o3的50.1%。较小的gpt-oss-20b同样表现出色,在相同任务中与o3-mini旗鼓相当,具备边缘计算部署潜力。 H2: 安全性设计贯穿全生命周期,防止滥用风险 尽管模型完全开源,但OpenAI强调其安全机制已深度集成。预训练阶段已过滤涉及化学、生物、放射及核威胁等敏感数据。训练后阶段引入审慎调整与指令层级结构,确保模型能有效拒绝不安全请求并抵御即时注入攻击。对齐专家Eric Wallace披露,团队进行了前所未有的安全测试,包括三组独立专家组评估对抗微调后的模型表现。结果显示,即使使用OpenAI训练堆栈进行强化微调,这些模型仍无法达到“高风险准备”级别,远低于o3模型的风险阈值。 H2: 保留无监督思维链推理,强化行为监控能力 OpenAI明确表示,未对两种gpt-oss模型的思维链(CoT)进行直接监督,以维持其原始推理路径的透明性。此举有助于持续监测模型是否存在欺骗、误导或滥用行为,是实现长期可控演进的关键策略。同时,公司刻意隐藏部分最佳模型的完整推理流程,避免被竞争对手复制,防范类似DeepSeek事件重演。 H2: 开源生态加速,推动行业创新与竞争格局重塑 目前,两款模型已上线Hugging Face平台,供开发者下载与实验。随着大模型本地化部署门槛降低,个人开发者、中小企业乃至学术研究机构将获得前所未有的算力自主权。这不仅促进AI应用生态繁荣,也迫使传统闭源厂商加快技术迭代步伐,形成新一轮技术竞争浪潮。 图片来源:OpenAI OpenAI此次发布不仅是技术突破,更是战略布局的重要一步。它在释放创新活力的同时,牢牢把控安全边界,为全球开源大模型发展树立新范式。未来,随着更多轻量化、高效率模型涌现,人工智能的普惠化进程将进一步提速。
声明:文章不代表比特之家观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
币圈快讯
查看更多
热门币种
BTC比特币
105,239.09 USDT
¥755,174.66
-%
ETH以太坊
2,517.54 USDT
¥18,065.36
-%
USDT泰达币
1.00000 USDT
¥7.18
-%
XRP瑞波币
2.15 USDT
¥15.44
-%
BNB币安币
646.71 USDT
¥4,640.66
-%
SOLSolana
145.58 USDT
¥1,044.65
-%
USDC
0.99980 USDT
¥7.17
-%
TRX波场
0.27410 USDT
¥1.97
-%
DOGE狗狗币
0.16830 USDT
¥1.21
-%
ADA艾达币
0.59440 USDT
¥4.27
-%
查看更多
回顶部