扎克伯格这一举动，会让中国90%大模型公司快速死亡吗？

原创 2023-08-20 15:58:52 · 浙江思享会 · 量子连线

什么才是正确的AI创业创新姿势?答案好像不是做大模型的。吃过见过，和王兴一起创立了万亿美团帝国的王慧文，大模型创业弄了一半，抑郁了，早早就退出了人工智能内卷，他或许提前看到了什么终局？王慧文的退出，并

什么才是正确的AI创业创新姿势?

答案好像不是做大模型的。吃过见过，和王兴一起创立了万亿美团帝国的王慧文，大模型创业弄了一半，抑郁了，早早就退出了人工智能内卷，他或许提前看到了什么终局？

王慧文的退出，并没有像他高调宣布进军大模型一样，引起什么产业波澜和反思。大家只是感叹有钱人看来只是表面快乐。

无论是大厂还是中小创业公司，大部分继续一股脑继续“造轮子”，做大模型开发。

对于人工智能产业，目前催生三个可见的赛道：

万亿级的是芯片公司，这是属于英伟达、AMD等超级公司的赛道，不属于任何中国企业。

千亿级潜力是开发大模型“造轮子”，OpenAI提供了大模型的思路，许多公司在OpenAI开源的基础上去模仿OpenAI开发自己的大模型。但是随着今年4月份OpenAI宣布不再开源，模仿者大部失去了方向，技术水平停留在ChatGPT 2.0左右阶段。

还有就是百亿级左右的赛道，各种搭建在大模型上的应用，把大模型作为底层技术，应用在各个领域，例如做各个产业的垂直模型，现在有在尝试医疗、法律、娱乐、绘画、数字人等等领域，目前大部分都处于试水阶段。

目前在中国，AI这条赛道上大家都喜欢抢着造轮子。根据中新财经统计，目前已有超90家中国科技公司发布AI大模型，而这个数字在今年4月份还仅为50多家，人工智能产业正在“百模大战”。

然而，造轮子这条赛道，在昨天大概率将被扎克伯格的Meta发布的Llama 2给终结掉。

一、Meta放大招Llama 2，让“造轮子”大模型创业者们心头一凉

昨天，Meta宣布Llama 2激起整个人工智能产业震荡。Llama 2即扎克伯格创建的Meta（Facebook）旗下专门推出的商用开源大模型。据Meta官方介绍，Llama 2大语言模型系列是经过预训练和微调的生成式文本模型，其参数数量从70亿到700亿不等。

Llama 2其参数和实际测试已经达到ChatGPT-3.5左右水平，先不说中小创业公司，国内就算许多大厂，如文心一言、通义千问、360智脑都不能达到这个水平。

作为人工智能领域权威之一的机器学习科学家内森·兰伯特（ Nathan Lambert ）直言，Llama 2 性能是超过GPT-3的，对许多闭门造大模型的公司是个巨大的打击，这个模型（Llama 2）将满足大多数公司对更低成本和个性化的需求

Llama 2对于人工智能应用，就像手机APP开发之于安卓操作系统一样，其目的就是让应用层开发者们不用重复造轮子，直接用最低成本获得大模型的基础设施使用。

几个月前，Google曾公开表示，因为有开源社区，我们（Google和OpenAI）没有护城河。或许是美国巨头们已经想明白，大模型本身并不具备护城河，而是某个开源大模型上面形成的应用生态将是最大护城河。

这个生态看起来是美国巨头们蓄谋已久。作为Meta宣布的首批合作伙伴之一，亚马逊云科技宣布，客户可通过Amazon SageMaker JumpStart使用由Meta开发的Llama 2基础模型。

而OpenAI 的密切合作伙伴微软，这一次成了 Llama 2 的首要合作伙伴。在未来，任何个人开发者或者中小公司，都可以最低成本调用Llama 2。

猎豹CEO傅盛在第一时间转发了Llama 2的文章，并配文“这一下不知道多少公司笑醒在深夜，多少公司哭晕在厕所”。

朋友圈下面，前搜狗CEO、百川智能创始人王小川留言：哈哈哈。表示赞同。

而此前就说公开说“大模型本身没有价值”的金沙江创投合伙人朱啸虎则留言说：“都是笑醒吧，又可以take free ride”，意思是大家都可以用免费的“轮子”了——OpenAI已经不再开源，而Llama 2的出现拯救了大家。

傅盛随后在其视频里公开表示，Llama 2将会让大模型白菜价、平民化，像自己这样做人工智能应用落地的才是正确的方向。

《量子连线》采访了一些在看人工智能项目的投资人，他们都表示目前已经不会再投“国产大模型”。业内许多人已经达成共识，大模型就是一堆代码，如果没有落地产业生态，意义不大。

目前看来，大模型需要生态，以及大规模资金投入，这也不是一般中小创业公司和投资机构能长期承担的，美国方面有科技媒体透露Llama 2目前保守估计训练成本高达2500万美金。而整合亚马逊云，微软等生态更是不可想象的资源。

百度高管吴甜曾在几天前表示，真正从底层做起来的大模型成本非常高，国内大模型终局将只有几家能活下来。

只是想不到终局来得如此只快速。

二、搞基础设施是浪费资源，硅谷创业者反而比较清醒

王小川曾在4月份说中国大模型比美国技术落后了3年，而百度方面则认为没有那么大差距，为此双发还打了嘴仗。

但不管差距多久，商业竞争先发优势是非常重要的。安卓系统如果晚两年发布，将不具备今天的生态；微信如果晚米聊两年出现，张小龙必然不会有今天的成就...正如《从0到1》所描述的，互联网是个能把先发规模优势发挥到极致的领域。

也许是监管和中美环境，让中国大厂们，甚至创业者心存侥幸，觉得还可以有几年的发展空间，还能在基础设施上努努力。但是随着监管规则的落地，以及硅谷大模型基础设施的逐渐成型，再做轮子已经没有任何意义。

其实在硅谷，大部分中小创业公司并没有在重复造轮子，他们早已经开始研究人工智能应用方向。例如最近兴起的AI Agent概念——AI工具能够自主工作和反馈，感知所处工作环境并作出反应，通过自主决策和行动完成某些任务，还能通过学习、反思进行迭代。整个过程几乎不依赖人类的指令和监督。

例如Inflection AI是一个人工智能旅行私人助理公司，在6月底筹集了13亿美元资金。该公司正在开发一款私人助理，可以担任顾问角色，处理诸如在旅行延误后获得航班积分和酒店等任务，解决了人们繁琐的旅行事务。

另外一家初创公司Adept，筹集了4.15亿美元资金。Adept研发的模型Action Transformer(ACT-1)，仅需一句提示语，便可以自行进入公司Salesforce客户关系数据库，完成一项据说需要人类点击10次或更多点击的任务。

而人工智能角色生成聊天软件Character.ai以10亿美金估值获得了1.5亿美元的投资，Character.AI 允许用户以各种人物（例如明星、历史人物）等人物为模型创建人工智能聊天机器人，还可以帮助用户去和自己的男女朋友聊天，以增进感情。

大模型，在未来更多将是像云一样的基础设施，需要的企业或者用户直接进行采购和调用。

一些接受采访的软件开发者对《量子连线》表示，调用大模型非常简单并且成本不高，一些开发者在今天已经开始测试调用 Llama 2。

甚至一些把自己的微信聊天接入了。之前他们需要使用一些类ChatGPT的开源软件，现在直接使用 Llama 2，有了 Llama 2 这样的开源大模型，自研的意义更小了。