由于依赖于标准架构,因此易于使用,可以直接替换任何使用的系统。同样不走寻常路的还有最新杀入战场的苹果。近期,苹果公司作为()项目的研究机构之一,在上发布了开源模型,而且比其他公司更开放。
据了解
该模型性能已经超越了,并且正在逼近其他领先的 开源 BC 数据香港 模型,包括和。对此有科学家发出惊叹:“发布了一个击败的模型,但更棒的是他们完全开源了,包括预训练数据集!”二、小模型或成价格战“利器”有人将领域如此热闹的一周戏称为“小模型周”。事实上,今年以来,小模型的赛道早已开跑,今年月,谷歌发布了轻量级模型.。月,微软推出(小语言模型)系列,微软强调便宜得多,但响应能力接近比它大倍的模型,号称能力对标.。小模型,顾名思义指的是参数规模远小于一些大型语言模型的模型,常见的参数规模有.、、等。
尽管参数较少,但通过特定的设计和优化,小模型依然能够在某些任务上实现与大型模型相近的性能,同时降低计算资源消耗,提高能耗比。曾经信仰“大力出奇迹”的巨头们,如今前赴后继地入局小模型赛道,仍旧是出于那个绕不开的理由:“成本”。
今年以来
国内外大模型赛道的价格战愈演愈烈。自去年以来,已经进行了次降价,国内方面,月,字节跳动把定价降低了一个数量级,从以分计价进入以厘计价时代。根据火山引擎 了解所有优势 公布的价格计算,元就能买到豆包主力模型的万,大约是万个汉字。月日,世界人工智能大会()期间,百度宣布文心旗舰款模型.和.大幅降价,、两款主力模型持续免费。价格战打得火热的背后,尖端训练成本居高不下,甚至越来越高。斯坦福研究所发布的报告指出,当前尖端的训练成本正越来越高,报告显示,年训练最初的模型的成本仅为约美元,而到了年,模型的训练成本已经升至约万美元。
到了年
本更是分别达到约万美元和近亿美元。为此,小模型以更低 bw 列表 的成本,极致的性价比,成为模型公司卷价格战的“利器”。发布后,山姆·奥特曼在推特上发文指出,早在年,世界上最好的模型是,它比差得多,但成本要贵上多倍。成本更低的小模型给成本敏感型企业多了一重选择。的每百万输入为美分,每百万输出为美分,相对的,此前入门款模型.输入/输出定价是.美元/.美元,在此基础上便宜了超%。根据的统计,已经达到美国公司主流“小模型”里价格最低位置,比起、谷歌的同类型竞品都要更具性价比。