[行业新闻] 机器人产业链再添95家专精特新“小巨人”企......
2024-09-19
[行业新闻] 超维机器人|南方电网将在电网工程物资采购中......
2024-09-18
[行业新闻] 菜鸟启动第二批全球eHub建设,L4级无人......
2024-09-13
2024-09-12
[行业新闻] 前Figure总监带队,阿里押注深圳和而泰......
2024-09-10
[行业新闻] 国内手术机器人落地加速,直观复星经自然腔道......
2024-09-10
[行业新闻] Uber Eats在洛杉矶推出人行道配送机......
2024-09-09
2024-09-09
[行业新闻] 精彩直击!9月3日,2024武汉汽车制造技......
2024-09-05
[行业新闻] 亚马逊收购仓储机器人独角兽,创始人是三个华......
2024-09-03
[518原创] 第七期机器人行业全国巡回活动走进“超......
2024-09-13
[518原创] 重载AGV加持、产业提速——全国巡回......
2024-09-11
[518原创] 2024世界机器人大会在京开幕 人形......
2024-08-21
[518原创] 2024亚太国际智能装备博览会——搬......
2024-07-20
此外,在大模型的推理效率上,创新奇智通过高效的搜索引擎和 4 比特量化技术大幅降低计算资源需求,实现了 75B 大模型的双卡可推理,满足了大量企业级应用场景的需求。针对众多企业大模型私有化部署的需求,创新奇智还与合作方共同构建了基于国产算力的一体机。
创新奇智还升级、发布了生成式企业私域视觉洞察应用 ChatVision、生成式辅助工业设计应用 ChatCAD、工业机器人任务编排应用 ChatRobot Pro 等一系列能力。
切入工业机器人,探索端到端方向
说到工业机器人,创新奇智在这个方向上正进行着最前沿的探索。
ChatGPT 等大语言模型的发展,正在为机器人领域掀起一场革命,有最先进的大语言模型加持,机器人终于拥有了一颗聪明的大脑。
今年初,斯坦福大学的「炒菜机器人」ALOHA 问世,引发了一片关注。利用新一代技术,机器人似乎已经可以胜任全职管家了。
在斯坦福的工作中,研究者开发了一套系统,用于机器人模仿学习需要全身控制的双臂移动操作任务。它通过一个全身远程操作界面进行有监督的行为克隆收集数据,并在此基础上让机器人进行训练。当面对不同形态的物体时,机器人依然能根据之前的训练数据完成诸如刷碗等基本动作,实现了一定程度的自动化和适应性。
创新奇智正在构建的 ChatRobot Pro 生成式工业机器人调度应用,也使用了相同的思路。在去年基于大模型智能体实现高层次调度编排的基础上,新版本的 ChatRobot Pro 结合了多模态、端到端的 VLA(Vision-Language-Action)策略模型,持续优化了工业大模型的感知、理解、规划、决策能力,大幅提升了机器人操作的任务泛化性和交互友好性。
ChatRobot Pro 的核心是端到端的 VLA 策略模型,它可以接受图像输入并配合语言指令进行下一步动作的预测。与以 token 形式输出文本内容的大语言模型不同,在 VLA 模型中,算法需要实时处理视觉环境中的动作,快速准确地面对外界做出连续的动作反应。创新奇智的机器人可以保持一秒钟 30Hz 的动作刷新率,确保了行动连贯流畅。
VLA 大模型是一种能够在视觉、语言及动作之间建立联系的强大工具,它可以接收来自多个传感器的数据(例如三个摄像头图像),解读复杂的任务指令,并输出相应的动作,指导机器人执行精确的操作,如调整物体位置等。与传统的机器人相比,VLA 具有更强的理解能力、学习能力和响应速度,适用于需要实时处理复杂情境的任务场景,如工业生产中的质量检测、产品组装等。
在这里,系统采用了云边端协同架构,其中机器人旁的端侧算力负责本地部分数据处理,端侧 VLA 算法进行最终决策,以支持机器人在复杂环境下的自主决策和高效执行。
我们在实验室里看到了 ChatRobot Pro 早期形态的演示。仅通过上百次人类操作的「指导」,收集数据加训练时长不到一个月,实验室里的机器人就已经学会拿起扫帚打扫碎屑:
它也可以识别杯中小球,并将其倒入空杯子:
实现自主学习与行为模仿,标志着机器人在柔韧性和泛化能力上出现了重大突破。未来,我们或许不再需要依赖僵化的编程指令,只需通过接收大量真实操作数据训练视觉大模型,就能让机器人在实际环境中完成更加灵活多样且高效的任务。
这不由得让人想起自动驾驶领域中,基于视觉大模型的端到端方法正在实现的革命。端到端的自动驾驶很快就要上路了,我们可以期待机器人领域也会发生同样的事。
不过相比之下,自动驾驶拥有大量现成可用的数据集。为了更好地发展视觉模型驱动的机器人,创新奇智正在构建 Robot 数据集,其中包含丰富的视角数据,如各类动作的全部轨迹信息。工程人员还在不断整合各类开源数据,力求将其打造成为一个领先的工业领域大规模数据集。
随着端到端大模型技术的提升,复杂任务规划与执行算法的发展,新一代机器人或许可以解决工业领域中的一系列手动、劳动问题,尤其是那些无法通过传统自动化技术解决的任务,比如手机装配中的精细操作环节。
拥抱 AI2.0
最新发布的财报显示,创新奇智在技术和产品创新方面保持着高投入:近年来研发支出占营收的比例均保持 25% 以上。从大模型技术落地,再到端到端视觉模型驱动的机器人,创新奇智的一切努力,都是为了冲击 AI 2.0。
如果将 2018-2022 年定义为 AI 的 1.0 时代,这一代的人工智能以卷积神经网络为基础,其表现为能听能看,可以进行判断识别等任务。过去的几年里,人工智能已经带动了很多行业的自动化变革,但在其中,真正的智慧还没有出现。
大模型技术正在将 AI 推动到 2.0 时代,它克服了上一代 AI 单领域、多模型的限制。利用海量数据训练的,具有跨领域知识的基础模型(Foundation Model)能够完成多模态的复杂任务,更能通过微调等方式快速适配专业领域任务,真正能够实现平台化效应。
可以说,在 AI 1.0 的时代,工业视觉的加持让机器睁开了双眼,到了 AI 2.0 时代,机器人的大脑不再需要人类将所有动作编程,每一个 Action 都将是由大模型来驱动的。
第六期“全国移动机器人行业巡回调研活动”合作商招募中
报名热线:400-0756-518
活动时间:2023-09-01至11-30
Copyright © 2018-2025, 服务热线 400-0756-518
www.zhineng518.com,All rights reserved
版权所有 © 518智能装备在线 未经许可 严禁复制 【冀ICP备19027659号-2】 【公安备13050002001911】
运营商:河北大为信息科技有限公司