作者 | 张凯旌
编辑 | 趣解商业
岁末年终,大模型厂商们又秀了一波“肌肉”。
2月1日,此前在大模型领域一直保持“静默”状态的字节跳动终于有了新动作,其上线了“Coze扣子”AI Bot开发平台;与过往聊天机器人的形式不同,“扣子”更像是2023年11月Open AI发布的GPTs,可以让用户通过聊天、调用插件等方式,创建个人定制版Bot,实现“0代码”开发。
图片来源:微博截图
除了字节下场外,猎豹移动CEO傅盛创立的猎户星空也在1月21日发布了自己的大模型Orion-14B;傅盛强调,在企业应用场景中,猎户星空大模型在结合企业私有数据和应用时,即可实现千亿参数级别的模型效果。
而诸如科大讯飞、三六零等在2023年就第一时间抢滩大模型的厂商,如今则正迅速迭代;前者在近日发布了星火大模型V3.5,后者则上线了大模型搜索App“360 AI搜索”。
就在不久之前,手机厂商也纷纷涌入了大模型赛道。1月10日,荣耀发布了自研的70亿参数端侧AI大模型“魔法大模型”,自此,华为、小米、OPPO、vivo、荣耀五家国产主流手机厂商在大模型领域齐聚。同时,大洋彼岸的苹果据传也正在测试在iOS 18中引入生成式AI功能。
图片来源:微博截图
“百模大战”似乎并没有随着时间的流逝而偃旗息鼓,反而是愈演愈烈。厂商们如今都打着怎样的算盘?2024年的大模型赛道会迎来新的重大变革吗?
01.大厂涌入,赛道拥挤
ChatGPT的出现并非毫无征兆。
创造它的OpenAI早在2015年便已成立,并在2018年就推出了初代生成式预训练模型GPT-1,这也是ChatGPT最初的原型。
在此之前,业内的NLP模型(自然语言处理)主要是基于针对特定任务的大量标注数据进行训练,能力有限。
GPT在自然语言推理、问答任务和常识推理等方面取得了突破,为此它也获得了微软10亿美元投资。随后,从GPT-1到GPT-2,到GPT-3,短短2年时间里GPT的能力不断提高。
图片来源:OpenAI官网截图
2022年11月27日,随着由GPT-3.5修改而来的人工智能对话聊天机器人ChatGPT的推出,这个一直在小圈子走红的研究成果,才第一次为大众所认识。能聊天、画画、写文案、编代码,强大的功能,使得ChatGPT一经发布迅速走红,5天时间注册用户数超过百万,两个月时间月活突破1亿,成为史上增长最快的消费者应用。
消息传至国内,一石激起千层浪。人工智能竟然已经发展到如此地步了?震惊之下,淘宝上售卖ChatGPT账号甚至都成了一门生意。与此同时,看到巨大商机的各界大佬们,也纷纷下场,表态要尽快推出自己的大模型。
从2023年的3月到9月,各个互联网大厂在该赛道争先卡位。从百度的大语言模型“文心一言”、360的智脑大模型,到阿里巴巴的“通义千问”大模型、科大讯飞的星火大模型,再到腾讯的混元大模型,国内传统的三大互联网巨头“BAT”悉数下场。
此外,华为、京东、商汤科技、网易有道、昆仑万维(300418.SZ)等等都陆续推出了大模型产品,甚至连移动、联通、电信三大运营商,长虹等家电生产企业,清华、复旦、中科院等科研院所和高校,都发布了各自的大模型。
图片来源:华为云AI公众号
2023年5月的中关村论坛上,专家口中中国“10亿级参数规模以上”大模型的发布数量尚为79个;而据GitHub的统计数据,到2023年底国内已经发布的大语言模型接近300个。“百模大战”早已不是虚言。
不过相比当初外卖界的“百团大战”,“百模大战”对资金的需求更为苛刻。
根据NVIDIA官方信息,在训练底层模型阶段,训练一次1750亿参数的GPT-3需要34天、使用1024张A100 GPU芯片,而为了维持日常推理,OpenAI至少需要3.24万张A100;以此推算,ChatGPT仅硬件成本就超过了8亿美元。
昆仑万维集团CEO方汉更是公开表示,“没有2000张A100的卡,实验都做不了”。为此,海天瑞声、因赛集团等“AI概念股”甚至接连发布定增预案,募集资金用于训练大模型。
图片来源:罐头图库
此时,如何在缩小与ChatGPT差距的同时,尽快找到应用落地的方向,并实现自我造血,成为了“百模大战”中,每一位参与者都要面对的问题。
02.大模型,有何应用场景?
从商业角度分析,大模型带来的机遇,可以概括为成本减少效率提升、原有市场需求再扩大、创造新的市场需求三大类。
大模型超强的人机对话、图文及音视频生成能力,不但让其在传统客服场景中获得了广泛应用,对于游戏、影视制作等也产生了深远影响。
阿里、美团的在线智能客服算法,以及中国移动的“九天大模型”、中国电信的TeleChat大模型等,都属于此类产品,将应用场景直接锁定在了智能客服、智慧政务等方面。在2023年的亚运会上,科大讯飞与中国移动联合推出了基于星火大模型的5G新通话,接完电话之后,申请服务,会即刻转成文字、生成纪要、生成待办事项。
游戏、影视制作方面,导演陆川曾在采访时表示,“用AI画电影海报,15秒出来的效果比专业海报公司做一个月的还要好。”
图片来源:微博截图
原有市场需求再扩大,则体现在对于传统业务的升级上,这也是大模型应用最广泛的领域。
以传统的搜索引擎为例,接入文心一言后,在百度搜索框里输入问题,给出的可以不再是链接,而是一个更确定的答案。以此为基础,百度地图、网盘、文库等应用都能通过接入大模型进行重构。
旗下业务众多的腾讯,对腾讯云、腾讯广告、腾讯游戏、腾讯会议等多个业务和产品,也已完成了接入腾讯混元大模型的测试,并取得了初步效果。
图片来源:腾讯混元官网截图
此外,在传统的教育、医疗、汽车等领域,大模型也获得了广泛的应用。
接入讯飞星火大模型后,科大讯飞的学习机实现了AI一对一辅助教学、中英文作文批改、口语陪练等功能;百度推出了产业级的医疗行业大模型“灵医”;华为云盘古大模型的赋能,则让问界新M7在智能驾驶领域“遥遥领先”,两个月大定突破10万台。
在创造新的市场需求方面,AI超级助理、AI机器人等需求也被不断创造出来。前者,包括文心一言、讯飞星火、通义千问等在内的各家通用大模型都有相应产品,它们大都能理解用户的语言语义,并具备图像理解能力,可以通过调用软件API,使用各种各样的工具来帮助用户完成任务;而后者则已有包括优必选、追觅、宇树在内的不少于 10 家机器人企业,展出过相关产品。
图片来源:通义官网截图
不过,在一片欣欣向荣背后,也存在隐忧。比照各家大模型的应用不难发现,不管是提高效率还是扩大需求,市场上绝大多数的应用,实现的功能都较为雷同。
以AI学习机为例,除了科大讯飞有相关产品外,接入子曰大模型的网易有道、接入MathGPT的好未来、接入银河大模型的作业帮,以及接入文心一言的百度、接入360智脑的360,都有类似的产品在售。功能方面,各自宣传的也都大同小异,AI一对一辅导、全科AI作业助手、虚拟人口语教练等,站在消费者的角度,几乎很难体会到其中的差别。
图片来源:罐头图库
尽管各家都能拿出一堆的排名榜单来论证,自己的大模型得分更高、能力更强;但体现在实际应用中时,那百分之几甚至是千分之几的差别,还是让人不得不产生疑惑:我们真的需要这么多大模型吗?
03.2024会出现“杀手级应用”吗?
尽管市场中的大模型让人眼花缭乱,但行业对大模型发展的趋势还是形成了一定的共识。
百度创始人李彦宏就曾表示:“人类进入AI时代的标志,不是产生很多的大模型,而是产生很多的AI原生应用。”360创始人周鸿祎也在今年年初谈及大模型发展趋势时称,2024年将成为大模型应用场景之年,会出现“杀手级应用”。
这也意味着,大模型与C端用户的距离会越来越近。
字节的“扣子”平台就是一个例子。据“趣解商业”了解,其有着无限拓展的能力集,用户可以通过添加插件的方式,来不断强化自定义Bot的能力;此外,用户还能将本地文件上传到Bot的知识库中,供其学习;创建出来的机器人,还能部署在不同的社交平台和应用程序上。
图片来源:扣子官网截图
这等于是给用户提供了自己开发聊天机器人的机会,让更多人能参与到AI生态的建设中。
与此同时,大模型也正在经历软件、硬件一体化协同的过程。
在这方面,智能手机厂商无疑是业界的代表。据“趣解商业”不完全统计,在国产智能手机中,目前华为Mate60 Pro、小米14 Pro、vivo X100系列、OPPO Find X7系列、荣耀Magic6系列等手机都已搭载大模型。
这些大模型除了能让AI助手变得更为智能外,还有一个重点的应用领域是手机相册。原来想消除照片中的其他游客,只能用PS,且考验手法和技术;现在直接应用AI抹除功能,就能一步到位且几乎没有破绽。
类似的还有美图公司(1357.HK)自研的AI视觉大模型“奇想智能”。其已与三星达成合作,用户可以在Galaxy S24系列手机上体验AI图像编辑功能;不仅可以“智能p图”,还能通过用户给出的图片进一步生成“AI画风”。
图片来源:微博截图
与手机对标的场景是PC(电脑)。1月,联想已经发布了AIPC产品,其在内嵌大模型后,有更强的算力支撑能力、人机交互更为智能、应用生态也更加开放。
而金山办公(688111.SH)推出的WPS AI就是可以在PC平台上应用的软件产品。其将重点放在了智能文档上,可以帮用户轻松创作办公所需的文本、PPT,还能自主消化PDF等文件资料,并解答有关这些资料的问题。
此外,教育也是一个重要的应用场景。科大讯飞、好未来、作业帮、网易有道等厂商都将大模型融入AI学习机中,教育类学习平板电脑的销量更是在2023年直线上升。而且基于产品的迭代,学习平板的价格还在不断走高。
图片来源:罐头图库
深度科技研究院院长张孝荣认为,大模型未来可能会朝专业化与个性化、低门槛化的方向发展。模型的功能会更加细分,针对特定领域或特定需求进行优化;同时通过提供更友好的界面和更便捷的接口,降低使用难度,让更多的人参与到基于大模型的开发和研究中。
而且由于算力所限,大模型可能更多地部署在云端和边缘端;这样可以降低计算资源和存储资源的消耗,提高模型的响应速度和可用性。
但无论是哪种趋势,都要与实际成本相结合;否则只是一味投入,显然难以为继。
三六零(601360.SH)在2023年上半年,尽管新兴业务“360智脑”创造了近2000万元营收,但在9.1亿元的总收入中,占比不过2.1%。
图片来源:罐头图库
科大讯飞(002230.SZ)2023年预计扣非净利润同比下降71%-81%,主要原因就与公司在自主可控平台上加大认知大模型研发投入有关。
除此之外,如何让用户更好地理解大模型的决策过程和结果,提高其信任度,也是一个关键的问题。
04.中外大模型差距在哪?
国内大模型产业如火如荼,美国则更甚。根据《中国人工智能大模型地图研究报告》,全球累计发布的大模型中,中美两国大模型数量占近80%。早在2023年5月,美国10亿级参数规模以上的基础大模型就已突破100个。
除了广为人知的ChatGPT外,美国具有代表性的通用大模型公司还包括Anthropic、Cohere以及Google等。
其中,Anthropic被称为“OpenAI劲敌”。其研发的聊天机器人Claude能一次性总结约7.5万个单词,比ChatGPT更适合处理长对话和内容、对大量文档进行深入分析,而且具备更快的平均响应时间。
图片来源:微博截图
Cohere的特点则是其差异化的定位。不同于OpenAI,其坚定选择了toB路线,提供灵活性存储和资料隐私保护路径,强调安全性、隐私及定制化服务。
至于Google,最新的情况是推出了AI模型Gemini,特点是多模态处理和对复杂逻辑的理解能力。在行业标准MMLU(多任务语言理解)基准测试中,Gemini是唯一一个成绩超越人类专家测试结果的AI模型。
图片来源:微博截图
北京市社会科学院研究员王鹏认为,中美大模型的差别主要体现在融资水平、基础大模型发展水平和应用层发展水平三个方面。
据不完全统计,2023年上半年,美国AIGC一级市场中,硅谷在人工智能领域融资总金额约140亿美元,占世界总融资金额的55%,平均轮次融资金额为3.3亿美元。同期国内人工智能领域则要谨慎得多,投资事件数量同比下降49%,涉及总金额61.74亿元,同比下降62%。
而在基础大模型发展水平方面,国内大模型还存在数据总量缺乏、算力资源缺乏、场景渗透率有限等问题。毕竟从公开数据量上看,英文数据本身占主导优势,美国还在采取多种方式限制中国获取算力的核心资源。
至于应用层方面,中国同样处于跟随状态;其中在办公、金融及医疗领域落后美国较为明显。
图片来源:趣解商业
针对众多国内厂商都有宣称自家大模型已经超越GPT-4的情况,张孝荣认为:“从理论上说,某些厂商有可能在局部领先于GPT4,但考虑到双方在算法、算力和数据资源等方面的投入,国内模型全面超越GPT4的可能性比较小。”
在他看来,需要正视国内外大模型的差距,这涉及到技术、人才、资金等各方面的因素。
好消息是,中国有着超大的市场规模以及丰富的应用场景,为大模型的落地应用提供了广阔的空间和条件。而且越多的数据、场景,越能让大模型更实用。这让中国在底层研发技术上略逊于美国的情况下,依然具备赶超美国的机会。
但无论中国还是美国,在大模型这条赛道上都还有很多难题待解。最典型的就是输出结果可信性不足、稳定性不强、以及安全性等问题。
对于人和AI来说,这都将是一个长期的学习过程。
字节终于等来了“豆包”
说说AI在跨境电商应用中的问题