训练模型跟训练学生类似,数据相当于教材或教育资源,过程就叫预训练。偏远山区的孩子和线城市的孩子,从小获得的教育资源不同,训练过程不同,最后高考考上重点大学的概率也必然不同。某种意义上,拥有优质数据,预训练就成功了半。 过去年,行业里评估个大模型好坏的标准,是通过测评,相当于考试。既然是考试,就有作弊的空间,或者可以通过刷题得高分。这就导致,很多大模型其实是应试教育的产物——参数大、得分高、性能强,但没啥实践能力。
李友峰认为,算法有很大局限性,如果脱离具体的应用场景,算法没有意义。比如模型的参数大,计算能力很强,做数学题也许表现很好,但这并不意味着它能在实际业务里产生价值。 今年以来,大模型拼参数的风气有所改观,各种杂七杂八的野榜也有所收敛,说明公众不好糊弄了。问题是,如果不比参数,大家还能比啥? 二、卷价格:端不敢收,端收不起 个有价值,最直接的方 马耳他 电话号码 法是从市场上赚到钱。今年以来,越来越多创业者和投资人,开始将商业模式挂在嘴边。
大模型行业的商业化有两大类—— 和 ,即向个人用户收费,和向企业(包括政府、开发者收费。去年行业达成共识, 收费很难,先从端入手。 端企业是大模型的最大客户。家做系统集成公司的员工曾对「定焦」说,他们很早就接入了百度的千帆大模型平台,拥抱大模型的意愿很强,不过他们不是因为模型效果好而使用,仅仅是怕被落下。而旦模型收费,他们就得再考虑考虑了。 这代表了很多企业的心态:能白嫖就白嫖,付费就必须得看到效果。用陈冉的话说:让客户花钱,就得让他看到成倍的增效,不见兔子不撒鹰。