国产大模型独角兽,困在光环里
智东西
作者 ZeR0
编辑 漠影
11月16日,国产月之暗面举办了一场临时组织的大模媒体沟通会,说是型独平顶山市某某投资管理运营部特意选在Kimi开放一周年纪念日。
结果意料之外,角兽啪,困光发了款数学模型。环里
还跟OpenAI o1系列、国产GPT-4o、大模Anthropic Claude 3.5 Sonnet模型的型独测试分数做了对比。
这个举动搁在友商身上很正常,角兽但由月之暗面来做就有些稀奇了。困光因为这家大模型公司的环里作风一贯有些另类,不聊技术,国产只推拳头产品Kimi。大模
Kimi在今年年初的型独热度冲到一个高峰。铺天盖地的广告投放轰炸使这款智能助手产品声名鹊起。
快速攀升的Kimi用户数和影响力、“90后清华校友技术天才创业者”的创始人标签、阿里超10亿美元领投、Kimi概念股爆火……诸多光环叠加,将月之暗面捧成了一个新晋国产大模型“顶流”。
但很快其命运陡转,口碑逐渐下滑,质疑声扑面而至,这些光环也变成了缚住月之暗面的茧。
以前是好评如潮,但不知何时开始,月之暗面被冠以“大模型营销咖”的外号,模型乏善可陈,生态资源被大厂碾压,产品更新多为缝缝补补。
一些针对产品效果的负面评价也声量渐起:“动不动让换个话题”、“有时会瞎编”、“整理资料糙”、“听不懂需求”、“幻觉和错误严重”、“指出它错了还犟嘴”……这些大模型通病,在用户心里埋下失望的平顶山市某某投资管理运营部种子。多位用户吐槽说,Kimi最近莫名地越用越差,感觉比以前变蠢了,甚至有人怀疑这是不是想逼用户付费。
这是大模型竞赛中的一个缩影:当发展速度跟不上讲故事的高度,当免费和低价策略挟住每一个参赛者,当Scaling Law信仰开始动摇,此时的转折,是新高潮前的过渡,还是凛冽寒冬的序曲?
大模型独角兽们,集体走到逆风时刻。
一、月之暗面的B面:特长被复刻、出海失利、被前资方“逼宫”
2023年10月,月之暗面发布支持输入20万汉字的智能助手产品Kimi。
彼时,这是全球市场上商用大模型服务中所能支持的最长上下文输入长度。在高曝光度加持下,Kimi凭借“最强长文本”特色,很快在AI聊天产品大战中杀出重围,收获增长和口碑。
凶猛的推广投放为Kimi争取到先发优势。今年年初阿里的大笔投资进一步增加了月之暗面的曝光度。在4月Kimi智能助手支持200万字上下文后,二级市场一度掀起Kimi概念股热潮。
红得发紫,是A面的月之暗面。
但在另一侧B面,这家明星国产大模型独角兽,已经频频陷入麻烦中。
难守的“特长”
Kimi爆火后,很快“长文本”成为大模型突破的共识方向。
竞争对手们纷纷高调跟上,3月22日,阿里通义千问开放1000万字长文本能力,360智脑宣布内测500万字长文本能力,百度宣布文心一言4月升级逾200万字的长文本能力。
之后,Kimi仍努力拉大优势,今年10月上线具备AI自主搜索能力的Kimi探索版,搜索量是普通版的10倍,一次搜索可以精读500个页面。
但Kimi的身份,已经从引领潮流者转向追随者,上周新推出的对标o1的数学推理模型,便是在走OpenAI打过样的路。
激进投放
Kimi在投流上的生猛,连大厂掌门人都侧目。
在百度2024年第三季度总监会上,百度创始人李彦宏谈道:“AGI是个长期探索的事情,文小言的推广没必要像豆包、Kimi那样激进。”
自发布以来,Kimi在字节旗下穿山甲、B站、小红书等渠道进行了大规模投流。一张网传图表显示,Kimi的季度投放金额豪横到上亿元,吊打多数竞品。Kimi还长期推行免费策略,直到今年5月才首次试水商业化,启用打赏模式。
这带来的回报是领先的用户增长和产品影响力。但无论是月活、活跃用户留存率还是免费App下载排名,Kimi都被字节豆包压了一头。
出海止步
今年年初,月之暗面在海外推出情感陪伴类AI对话产品Ohai和AI生成视频工具Noisee。
据创投日报援引知情人士消息,其出海项目在今年6月就已撤掉。前Noisee产品负责人明超平、前Ohai产品负责人已于近期离职创业。
上周六,杨植麟回应说月之暗面今年二三月份开始聚焦和缩减,主动做减法,更加聚焦业务,先聚焦,后全球化,要更有耐心。他说过去一年给其团队上的一课是,几个业务一起做,会活生生把自己变成大厂,没有任何优势。
套现疑云
除了产品竞争压力外,月之暗面也陷入一系列舆情风波中。
今年4月,杨植麟被传通过售出个人持股套现数千万美金,随后月之暗面进行辟谣,但其中牵扯出的“资本贵人襄助论”长期余温未了。
前金沙江创投管理合伙人张予彤是循环智能最早的天使投资人,与杨植麟是清华校友,4月份离开金沙江创投。有报道称,月之暗面获阿里领投的A+轮融资,正是归功于张予彤的牵头促成。
仲裁风波
11月11日,据《暗涌Waves》报道,月之暗面创始人杨植麟、联合创始人兼CTO张宇韬被循环智能7家投资方中的5家(金沙江创投、靖亚资本、博裕资本、华山资本、万物资本)申请仲裁。
这场利益纠葛牵扯到三位清华同窗杨植麟、张宇韬、陈麒聪在2016年创办的循环智能。循环智能主要做企业营销客服AI软件,在2018~2021年完成5次公开融资,此后再无新融资披露。
极大的落差,被业界推测是循环智能老投资方们发起仲裁的导火索。
杨植麟此前曾在采访中透露:“我们2023年2月开始集中做第一轮融资,如果delay(延迟)到4月,基本没机会了。”之后其动作相当麻利,3月创办月之暗面,8月推出Kimi,今年暴风吸金,获得腾讯、阿里、小红书、三七互娱、美团、小红书等名企投资,估值扶摇直上超过30亿美元,远高于循环智能用8年时间发展到的估值。
该仲裁事件的后续及影响,仍有待观望。
二、国产大模型独角兽的“四重困”
今年,国产大模型江湖格局生变,创业头部梯队从“四小龙”变为“六小虎”,即智谱AI、月之暗面、MiniMax、百川智能、零一万物、阶跃星辰。
智谱AI和MiniMax成立时间较早,另外四家则都是在2023年3~5月期间创办。
借势2021年大放水和生成式AI飞升的红利,过去两年,资本密集汇向这几家大模型初创公司,只用短短一两年就将它们拱到独角兽身价。
百川智能、智谱AI、月之暗面均跻身200亿元估值俱乐部。今年6月,阶跃星辰被传正在进行一轮估值20亿美元的新融资。
金沙江创投主管合伙人朱啸虎今年3月接受腾讯新闻《潜望》采访时的发言,道出了一些质疑者的心声:“这些公司,要场景没场景,要数据没数据,你说它有什么价值?而且一上来估值这么贵。”
资本的追捧,与其在商业市场上的实际表现,始终存在着隐性的不平衡。
以前“六小虎”各具特色:智谱AI是正统清华科研班底,最早探路大模型研发,在To G、To B布局上都摊得较广;MiniMax在多模态和出海产品上保持领先;月之暗面手握爆款产品Kimi,不怎么强调背后模型;百川智能由王小川领衔的前搜狗团队创办,一年发了十多款大模型,并在AI医疗方向发力;零一万物由李开复组局创办,热衷于打榜;阶跃星辰则由前微软全球副总裁姜大昕创办,快步形成“万亿参数MoE+多模态”矩阵。
但一些变化已经显现。
1、人才之困
AI大模型独角兽们陷入的争议,很容易让人联想到AI 1.0创业时代的“CV四小龙”,高人才密度、强技术实力未能转换成高回报的市场竞争力,迄今难逃亏损魔咒。在生成式AI巨浪兴起后,不少来自互联网大厂及商汤、旷视的技术、产品、工程人才转身遁入大模型公司。
大模型创企像个围城,外面的人想进来,里面的人又纷纷出走。这一年来,一大波骨干人才从“六小虎”出走,有的回流大厂,有的选择创业。
今年8月,前零一万物算法副总裁、模型预训练负责人黄文灏被曝已加入字节跳动;9月,MiniMax“星野”产品负责人张前川被曝改任产品顾问,不再参与MiniMax业务。零一万物联合创始人李先刚也被曝出已离职并重返老东家贝壳。
月之暗面则有多位前产品负责人在离职后选择创业。比如月之暗面前大模型产品负责人王冠在今年年初创立了AI视频方向的ONE2X,已完成天使轮融资;前Noisee产品负责人明超平正以5000万美元的估值为其新创业项目融资。
另据Z Potentials报道,零一万物联合创始人潘欣正式加入闪极,出任闪极科技合伙人。
人才有出,也有进。
今年8月,百川智能宣布中国人民大学高瓴人工智能学院、信息学院院长文继荣教授受聘担任百川智能“首席科学家”,月之暗面将微软亚洲研究院前首席研究经理谭旭招至麾下。
在团队扩张上,杨植麟称月之暗面在几个大模型创业公司中始终保持人数最少、卡和人的比例最高,认为团队扩得大对创新有致命伤害。
2、技术之困
上周大模型领域的一大热议话题是Scaling Law,这个大力出奇迹的暴力美学,碰壁了。
OpenAI、Anthropic、谷歌都被曝出新模型改进放缓,寻求转变路线。连已经离职创业的前OpenAI首席科学家Ilya Sutskever都跳出来一吐为快,说2010年代是Scaling的时代,但现在是时候重归奇迹和发现的时代了。
而模型提升见顶,意味着AI聊天产品的智力很难再出现质的飞跃。
不过多位业界大佬否认了“碰壁论”。OpenAI联合创始人兼CEO Sam Altman、微软AI主管Mustafa Suleyman、微软董事长兼CEO Satya Nadella、前谷歌CEO Eric Schmidt等都宣称Scaling Law依然有效、没有迹象显示放缓。
杨植麟对Scaling Law仍持乐观态度,认为用强化学习的方式,上限很高。他预测训练模型还有半代到一代的空间,这个空间可能会在明年释放出来,接下来重点会是强化学习,范式上会产生一些变化,通过不同方式去Scale。
在他看来,留存与技术成熟度呈正相关,把思考能力和交互做好后,留存会进一步上升。
3、产品之困
模型卷不动后,竞争焦点必然向产品转移。
To B方面,大模型独角兽同时面临同行的闭源模型和开源模型的竞争,低价策略仍是主旋律。
To C方面,市场尚未等来一个超级应用,AI产品同质化严重的情况一直存在,目标用户重叠度高,同类产品功能和体验互相借鉴模仿,产品转移成本低,又不像一些头部社交、电商平台用推荐机制拿捏住人性的弱点、形成上瘾机制,那么如何才能长久占领用户心智?
当前AI聊天类产品在便捷搜索和提高生产力方面有效发挥作用,但受众仍然有限。不断优化的产品功能和效果,仍未能消减很多用户对幻觉错误和沟通费劲等问题的埋怨。
大模型主要靠To B还是To C赚钱,不同观点都有拥趸者。摆在大模型创企们面前的,是涉及精简成本和聚焦核心业务的方向选择难题:如果盈亏主要依赖To C应用,那么投入高昂的训练成本是否值当?如果To B才是商业表现的征途,那么姗姗来迟的月之暗面是否已经输在起跑线?
对市场需求的精准把控很重要,但国内团队擅长“抄作业”。大厂可以轻轻松松推出爆款AI功能合集,而创企只能选准方向精兵作战。
现阶段,大厂靠传统优势依然胜出,语言类有字节豆包,视频生成类有快手可灵。
对于与豆包的竞争,杨植麟上周的回应是:不希望过多关注竞争,因为竞争并不产生价值。做正确的事情,而不是专门去做不一样的事。只要能有人实现AGI,都是非常好的结果。
月之暗面目前还是聚焦于Kimi产品和品牌,聚焦在团队认为上限最高的事情上,更关注如何迭代更好的技术和产品、产生用户价值,更聚焦在提升模型的思考推理能力。
据晚点10月份报道,月之暗面的多模态研究从去年10月开始,在研发视频模型,为确保产品更具差异性,对外发布计划仍在推迟。
4、财力之困
除去人力成本不谈,大模型创企还面临三大烧钱问题:训练贵、推理贵、获客贵。
大模型训练和推理已经不是稀奇事。据外媒披露,预计OpenAI今年创收35~45亿美元,亏损40~50亿美元;Anthropic今年收入有望达到10亿美元,亏损可能是OpenAI的一半。
为了降低大模型推理成本,杨植麟称kimi未来考虑限制次数,让用户自己做选择。
为了保住拉新和留存,投放在所难免。早期Kimi投流效果立竿见影,知名度快速攀升,B站和小红书布满了安利。随后一些AI产品争相效仿,带动用户转化成本上涨。在机场、地铁等场所,旅客对大模型产品的大屏广告逐渐习以为常。
至少截至今年,大模型还不是一门能赚钱的好生意,也尚未展现出长期商业盈利的潜力。
结语
很少有新生行业能像生成式AI这样,短短两年孕育出多家百亿级估值的明星企业,它们被迅速推上神坛,也承受着过高期待带来的困扰。
近期,产业对大模型似乎逐渐祛魅。人们不再容易因雄心勃勃的AGI技术信仰而陷入狂热,不再对百模大战保持耐心和好奇心,不再盲从大佬预言,不再轻信投资者夸大的创新者投资资本回报,也不再热议谁会成为“中国版OpenAI”。
对于大模型创企而言,两年的成长,还不足以解决概念丰满但产品骨感的问题,消除业界一个长期的疑虑:大厂资源雄厚,进可攻退可守,仅靠大模型营生的公司又如何自证造血能力?当听众不再相信故事,又凭什么支撑起百亿级的估值?
(责任编辑:知识)
-
据伊朗伊斯兰共和国通讯社24日报道,伊朗伊斯兰革命卫队地面部队与阿塞拜疆陆军当天在伊朗西北部阿尔达比勒省边境地区展开代号为“阿拉斯”的联合军事演习。 报道说,演习为期4天,两国陆军特种部队将在伊 ...[详细]
-
北京“课间15分钟”施行首日 学校:尚在适应期 将设置多种活动丰富课间
央广网北京9月2日消息记者 王进文 阮修星 实习记者 刘一诺)“我们都挺喜欢到教室外活动的!”赵悦童、刘瑾溪是北京市密云区第七小学的学生,平时喜欢玩扔沙包、“老鹰捉小鸡”等户外游戏。“老师告诉我们,原 ...[详细] -
2023年民政事业发展统计公报 截图 近日,民政部官网发布了《2023年民政事业发展统计公报》简称《公报》)。 《公报》披露,截至2023年底,全国60周岁及以上老年人口29697万人,占总人口的 ...[详细]
-
视频!菲律宾9701号船故意冲撞中国海警5205舰 来源:视频综合) 8月31日12时许,非法滞留中国仙宾礁的菲律宾9701号船寻衅肇事,位中国海警5205舰左舷,故意冲撞我舰,并发生碰撞。 ...[详细]
-
中国气象局启动重大气象灾害暴雪)Ⅳ级应急响应:预计,11月25日8时至11月26日8时,内蒙古东部、黑龙江中西部、吉林西部、辽宁西部和东北部等地有大到暴雪,新增积雪深度5至10厘米,局地12厘米以 ...[详细]
-
每晚7点开始,北京上演非洲风采灯光秀,喜迎中非合作论坛峰会召开
摘要:通过选取非洲的动物、植物、乐器、纹饰等特色元素,将自然风光与人文风情进行演绎与呈现。2024年中非合作论坛峰会将于9月4日—6日在北京举行。为迎接这次盛会召开,9月1日起,北京奥林匹克中心区、大 ...[详细] -
央视新闻消息,9月2日,外交部发言人毛宁主持例行记者会,有记者就核武器使用原则提问。毛宁表示,中方多次重申核武器用不得,核战争打不得。2022年1月,五国领导人发表了关于防止核战争的联合声明,也指出核 ...[详细]
-
9月1日,几天前我们刚发布乐高全球霍格沃茨返校日活动,最先开启的是北京王府井乐高品牌旗舰店“乐高哈利·波特陋居收藏版静态展”。图片来源:福小鱼此次活动为快闪模式,哈利·波特陋居收藏版静态展2024年9 ...[详细]
-
2024年的暑假,最火的是“大女主”三个字。暑期档最火的三部剧:黄亦玫,在《玫瑰的故事》里爱得起放得下,在任何时刻都坚定地遵从自我。薛芳菲,《墨雨云间》女主,绝不内耗,主打一个敢爱敢恨睚眦必报。在夏天 ...[详细]
-
泽连斯基称前线四个方向陷入苦战 资料图参考消息网9月1日报道据塔斯社莫斯科8月31日报道,乌克兰总统泽连斯基表示,在基辅控制的顿涅茨克地区和哈尔科夫州,乌军在前线四个方向陷入苦战。他8月31日晚在社交 ...[详细]