7月4日—7月7日,2024世界人工智能大会(WAIC)暨人工智能全球治理高级别会议在上海盛大举行。岩山科技(002195.SZ)旗下岩芯数智RockAI携其自主研发的Yan1.2多模态大模型亮相,展示了Yan架构在手机端、PC端、树莓派、机器人等各类设备上的离线部署能力和首创的“同步学习”实验室示例,为AI向着更高级的智能形态演进开辟了新的可能性。
RockAI是岩山科技旗下的科技创新型企业,也是岩山科技在人工智能领域布局的重要一环。近年来,岩山科技将人工智能业务视为推动新一轮增长的战略催化剂,全面拥抱人工智能浪潮,目前已在智能驾驶、类脑智能、AIGC等人工智能新兴领域进行了布局,致力于在移动互联、人工智能等前沿科技领域进行创新与合作,创造更加智能和便捷的未来。
RockAI:让每一台设备都拥有自己的智能
现场,RockAI团队展示了一款部署了Yan1.2多模态大模型的智能机器人小智,它能够基于Yan1.2的语音和视觉处理能力,实时识别环境、准确理解用户的模糊指令和意图,并据此控制其机械躯体高效完成各类复杂任务。值得一提的是,此次“小智”机器人搭载的核心硬件是以低算力著称的树莓派第五代芯片,在极低算力的设备上实现了强大的多模态能力。
比如,小智可以根据“让一让,我要放东西”的模糊指令识别其意图和行动方向,从而做出相应的避让动作。当有人问“小智,你现在看到了什么”或手捧书籍邀请小智一同看书时,它能够基于多模态能力进行学习和创作,精确描述环境和人物特征、学习书籍信息。而对于需要大脑和躯干协调完成、复杂程度翻倍的任务,小智的表现同样毫不逊色,如“在四步之内创作出以枫叶为主题的一首古诗”。
整个展示过程中,小智的表现生动地体现了Yan1.2大模型强大的多模态整合及生成能力,不仅能够处理复杂的跨语言任务,还能够针对不同需求和偏好,与人类进行自然的互动交流。除机器人外,此次大会RockAI团队也向在场观众展示了Yan1.2多模态大模型在树莓派端、手机端、PC端等其他低算力设备上的无损运行能力。
“同步学习”:通往AGI的创新路径
随着大模型在各行各业的加速落地,“群模时代”已然来临,其在不同领域的智能涌现也进一步催生了通用人工智能的想象空间。但现有模型大多局限于特定的领域,缺乏泛化能力,比如一个用于编程的大模型,可能无法处理现实世界的其他问题。而RockAI提出了一个新的构想——让大模型在不断变化的环境中像人类一样实时学习,个性化地自主进化,最终实现通用人工智能。
为此,RockAI不断尝试寻找反向传播的更优解,试图能以更低代价更新神经网络,同时以模型分区激活降低功耗和实现部分更新,目前,RockAI已经走通了全模态部分视觉、音频支持,“同步学习”也进入实验室最后验证阶段。
除机器人外,Yan1.2多模态大模型在树莓派端、手机端、PC端等其他低算力设备上的无损运行和泛化能力也令人惊喜,进一步印证了“同步学习”的可能性,即模型能够在不同环境中,针对不同需求和偏好,实时学习并提供个性化的AI服务。同时,RockAI还在会上正式宣布开放其面向开发者的开放平台,期望与更多行业生态伙伴共同探索通往AGI的无限可能。
下一步,RockAI期望Yan2.0向全模态实时人机交互的方向持续升级,随着同步学习机制的强化网上股票配资操作,逐步进化为通用人工智能操作系统,可以部署在手机、电脑,甚至电视、音箱、机器人等各类设备,根据用户的自然语言、行为以及所属的场景进行自主学习,实现个性化的通用人工智能服务,最终形成诸如群体智能等可交互的多样性机器智能生态。