本期聊聊大模型的事儿,想了足足十分钟,纠结于题目中“误区”这两个字到底合适不合适。实在是表达力有限,本文只表达个人观点,如果觉得不合适,那就是你对!
先说说为啥用“误区”这个词吧,由于近半年都在企划大模型上车的事儿,所以接触了一些车厂和供应商,在沟通过程中,聊着聊着就感觉聊飞了:
一、把AI当成LLM:大语言模型应该算是AI的一种技术手段,chatGPT的出圈儿让LLM成为AI应用的最佳范例之一,这就导致好多人觉得AI就是LLM。与车厂聊需求的时候,以前通过简单数据算法就可以很好解决的问题,但现在很多人觉得引入LLM就可以更智能了。
比如底盘、动力部门的需求,想实时根据路面去调整悬挂与电机输出功率,这算是“智能底盘”的典型需求,但这与LLM没啥关系。
昨天公司的科学家(AI算法大牛)举了一个例子,我觉得特别好的来说明这个事儿。我就现学现卖:与生物的进化相似,最初的生物是没有大脑的。但并不影响身体的控制,这算是一种神经反射。就像虫子,虽然没有大脑,但并不影响它在前进中躲避障碍。而进化了大脑的高级生物,对于身体的控制也是一种条件反射,大脑是用来思考更复杂策略与感情的。汽车目前其实是处于“虫子”阶段,智能底盘应该用的是更简单的数学算法,LLM解决不了这种条件反射式的直觉控制。
二、把LLM当成智能语音加强版:chatGPT第一次让人感觉电脑对面与自己聊天的是人类,很自然地就把应用方向与发展多年的智能语音联系到一起。以至于把很大精力放在了“聊天”应用上,导致研究课题跑到多轮对话效果、多人对话策略等方向上。
之前的文章中就说过关于智能语音的坑,先不说人们是否真的在车里有那么多聊天的需求,就单说这类需求真的是车载专用吗?比如在车里给孩子讲个故事或是提问题,甚至是让车机写段代码(某车评号演示过),看起来是挺炫酷,但这跟车有啥关系呢?这与当初车联网发展阶段,不断尝试让各种手机应用上车如出一辙。花了好多成本,演示的时候是噱头,但日常用车真的用吗?
不是说聊天没用。比如颗粒捕捉器告警灯亮起,新手通常会问:“这咋亮灯了?”如果副驾有个老司机,他会说这灯是啥意思,还会告诉你到快速路上高转数跑几公里就好了,甚至还会抱怨一下环保要求导致中国销售的汽车必须加这破玩意儿……
你看,这里可不仅是个语音的加强,而是对语言表达的补充,以当时语境去了解亮的是啥灯,并通过专业知识库找到解决方案,甚至扩展到这东西的来源。最关键的一点是,这是汽车专用场景!再进一步想,为啥要等人问?告警灯亮起,这个事儿可以直接触发老司机来解答问题,语音只是触发条件的一种!
三、泛娱乐应用上车:“大模型”、"多模态"、"生成式"......这些新概念如暴风骤雨般扑面而来,但在车端应用场景上却没有产生新需求。与车联网时代一样,大家就直接把PC、手机上的应用搬过来。文生图、文生视频,甚至直接照搬抖音中的各类插件。
国内几家头部LLM大厂都不约而同地提供了一个功能:通过用户描述生成桌面背景。要说桌面背景真的是可以追忆到90年代初的WIN32时代了,经历了漫长的岁月之后,人们依然对此有着深深的执念。
不可否认的是,主题、壁纸真的是个好生意,在智能手机、智能手表领域已得到充分的商业验证,甚至车机上也卖得相当不错。这也正好可以引申出另一个思考:新技术是要优化传统需求的体验,还是产生全新需求?
5G技术应该算是比较典型的例子。高成本的技术投入之后,并未带来新场景,而传统场景体验其实在4G时代就已经被充分优化。并不是说新技术不好,而是应用价值如果无法覆盖成本,那只能说明这项技术还没有达到普及的时机。
并不是说生成式图片没用,我要强调的是应该把它用在更符合汽车价值的场景中去。比如前面讲的颗粒捕捉器告警,如果在解释的过程中,还能通过图片或视频的方式显示其安装位置以及原理,是不是能更直观地让人明白应该如何处理,这就直接将以前的“故障通知”扩展为“解决方法”“原理知识”,不仅是体验的优化,更是新场景的拓展。
"区块链"、"元宇宙"、"大模型"......新概念层出不穷,汽车行业卷到这个程度后,恨不得每个新概念都要蹭一下热度。但从这一轮的大模型技术来看,算力、数据、算法三要素都需要巨大的投入。如果没有明确的价值场景,贸然投入大量成本,肯定是不划算的!
AI PC、AI手机的广告也轰炸小半年了,经历多年市场洗礼的用户们已经非常成熟,很难再被概念忽悠上头,市场端的表现证明了没有啥水花儿。那么面对中国越来越成熟的汽车用户群体,车厂也应该正视技术与价值之间的区别,不要盲目“上车”。
文章首发于公众号:昊叔说车
原创不易,转载请告知原作者,注明出处。