专注AI+制造：创新奇智大模型工业落地初显成效，探索工业智能机器人新方向

品牌　　【直播】　　50强　　整机　　【联盟】　　机构　　【视界】　　展会　　【招聘】　　云服务　　微博　　公众号AIrobot518　

AGV/IGV

机械手

软件/系统

服务机器人

无人车

【今日焦点】

【行业动态】

物流机器人: 潜入式AGV; 全向轮AGV; 重载式AGV; 牵引式AGV; 分拣AGV; 料箱机器人; 穿梭车; 复合机器人; 龙门机器人

工业机器人: 多关节机器人; 水平关节机器人; 并联机器人; 坐标机器人; 焊接机器人; 喷涂机器人; 码垛机器人; 协作机器人

[行业新闻] 解锁智能交通新场景资阳启动低速功能型无人......

2025-07-02
[行业新闻] 【科技创新引领新质生产力发展】装备制造挺起......

2025-06-30
[行业新闻] 全球最大具身智能数据工厂落地天津

2025-06-25
[行业新闻] 仅售1.68万！菜鸟发布新款无人车

2025-06-23
[行业新闻] 京东物流亮相2025廊洽会，展示物流科技、......

2025-06-18
[行业新闻] 河南省加快机器人、具身智能等产品创新，到2......

2025-06-18
[行业新闻] 刘强东为母校中国人大打造智慧快递服务中心，......

2025-06-17
[行业新闻] 九识无人车事故频发，核心创始团队系扎堆从京......

2025-06-16
[行业新闻] 济南首批25辆无人快递车正式上路：单票成本......

2025-06-12
[行业新闻] 平湖首批有牌照的“无人驾驶车”来了……

2025-06-10

[518原创] 聚焦6月移动机器人新品：中力、蓝芯、......

2025-07-01
[518原创] 招募：欢迎加入【第八期移动机器人行业......

2025-06-07
[518原创] 第八届 “全国 AGV 机器人百家企......

2025-06-07
[518原创] 8米高空轻舞承重线！揭秘捷象灵越托盘......

2025-06-04

NEWS / 新闻中心

专注AI+制造：创新奇智大模型工业落地初显成效，探索工业智能机器人新方向

来源:机器之心 | 作者:机器之心 | 发布时间: 302天前 | 2539 次浏览 | 分享到:

不过相比之下，自动驾驶拥有大量现成可用的数据集。为了更好地发展视觉模型驱动的机器人，创新奇智正在构建 Robot 数据集，其中包含丰富的视角数据，如各类动作的全部轨迹信息。工程人员还在不断整合各类开源数据，力求将其打造成为一个领先的工业领域大规模数据集。

此外，在大模型的推理效率上，创新奇智通过高效的搜索引擎和 4 比特量化技术大幅降低计算资源需求，实现了 75B 大模型的双卡可推理，满足了大量企业级应用场景的需求。针对众多企业大模型私有化部署的需求，创新奇智还与合作方共同构建了基于国产算力的一体机。

创新奇智还升级、发布了生成式企业私域视觉洞察应用 ChatVision、生成式辅助工业设计应用 ChatCAD、工业机器人任务编排应用 ChatRobot Pro 等一系列能力。

切入工业机器人，探索端到端方向

说到工业机器人，创新奇智在这个方向上正进行着最前沿的探索。

ChatGPT 等大语言模型的发展，正在为机器人领域掀起一场革命，有最先进的大语言模型加持，机器人终于拥有了一颗聪明的大脑。

今年初，斯坦福大学的「炒菜机器人」ALOHA 问世，引发了一片关注。利用新一代技术，机器人似乎已经可以胜任全职管家了。

在斯坦福的工作中，研究者开发了一套系统，用于机器人模仿学习需要全身控制的双臂移动操作任务。它通过一个全身远程操作界面进行有监督的行为克隆收集数据，并在此基础上让机器人进行训练。当面对不同形态的物体时，机器人依然能根据之前的训练数据完成诸如刷碗等基本动作，实现了一定程度的自动化和适应性。

创新奇智正在构建的 ChatRobot Pro 生成式工业机器人调度应用，也使用了相同的思路。在去年基于大模型智能体实现高层次调度编排的基础上，新版本的 ChatRobot Pro 结合了多模态、端到端的 VLA（Vision-Language-Action）策略模型，持续优化了工业大模型的感知、理解、规划、决策能力，大幅提升了机器人操作的任务泛化性和交互友好性。

ChatRobot Pro 的核心是端到端的 VLA 策略模型，它可以接受图像输入并配合语言指令进行下一步动作的预测。与以 token 形式输出文本内容的大语言模型不同，在 VLA 模型中，算法需要实时处理视觉环境中的动作，快速准确地面对外界做出连续的动作反应。创新奇智的机器人可以保持一秒钟 30Hz 的动作刷新率，确保了行动连贯流畅。

VLA 大模型是一种能够在视觉、语言及动作之间建立联系的强大工具，它可以接收来自多个传感器的数据（例如三个摄像头图像），解读复杂的任务指令，并输出相应的动作，指导机器人执行精确的操作，如调整物体位置等。与传统的机器人相比，VLA 具有更强的理解能力、学习能力和响应速度，适用于需要实时处理复杂情境的任务场景，如工业生产中的质量检测、产品组装等。

在这里，系统采用了云边端协同架构，其中机器人旁的端侧算力负责本地部分数据处理，端侧 VLA 算法进行最终决策，以支持机器人在复杂环境下的自主决策和高效执行。

我们在实验室里看到了 ChatRobot Pro 早期形态的演示。仅通过上百次人类操作的「指导」，收集数据加训练时长不到一个月，实验室里的机器人就已经学会拿起扫帚打扫碎屑：

它也可以识别杯中小球，并将其倒入空杯子：‍

实现自主学习与行为模仿，标志着机器人在柔韧性和泛化能力上出现了重大突破。未来，我们或许不再需要依赖僵化的编程指令，只需通过接收大量真实操作数据训练视觉大模型，就能让机器人在实际环境中完成更加灵活多样且高效的任务。

这不由得让人想起自动驾驶领域中，基于视觉大模型的端到端方法正在实现的革命。端到端的自动驾驶很快就要上路了，我们可以期待机器人领域也会发生同样的事。

不过相比之下，自动驾驶拥有大量现成可用的数据集。为了更好地发展视觉模型驱动的机器人，创新奇智正在构建 Robot 数据集，其中包含丰富的视角数据，如各类动作的全部轨迹信息。工程人员还在不断整合各类开源数据，力求将其打造成为一个领先的工业领域大规模数据集。

随着端到端大模型技术的提升，复杂任务规划与执行算法的发展，新一代机器人或许可以解决工业领域中的一系列手动、劳动问题，尤其是那些无法通过传统自动化技术解决的任务，比如手机装配中的精细操作环节。

拥抱 AI2.0

最新发布的财报显示，创新奇智在技术和产品创新方面保持着高投入：近年来研发支出占营收的比例均保持 25% 以上。从大模型技术落地，再到端到端视觉模型驱动的机器人，创新奇智的一切努力，都是为了冲击 AI 2.0。

如果将 2018-2022 年定义为 AI 的 1.0 时代，这一代的人工智能以卷积神经网络为基础，其表现为能听能看，可以进行判断识别等任务。过去的几年里，人工智能已经带动了很多行业的自动化变革，但在其中，真正的智慧还没有出现。

大模型技术正在将 AI 推动到 2.0 时代，它克服了上一代 AI 单领域、多模型的限制。利用海量数据训练的，具有跨领域知识的基础模型（Foundation Model）能够完成多模态的复杂任务，更能通过微调等方式快速适配专业领域任务，真正能够实现平台化效应。

可以说，在 AI 1.0 的时代，工业视觉的加持让机器睁开了双眼，到了 AI 2.0 时代，机器人的大脑不再需要人类将所有动作编程，每一个 Action 都将是由大模型来驱动的。

« 上一页 123 下一页 » 查看全文 »

上一篇：深圳市第六批国家级专......

下一篇：案例 | 稳石机器人......

第八期“全国移动机器人行业巡回调研活动”合作商招募中

报名热线：400-0756-518、13512726426 同微信

活动时间：2025-08-01至08-31

金峰集团再次入选《2025年中国仓储配送行业发展报告》编委会编委
大阪世博会中国馆举办“优必选企业活动日”，向世界传递中国AI
新品发布 | 大象机器人myAGV Pro —— 探索更高效的移动复合机器人解决方案
海康揭秘！大连“最强大脑”平稳运行背后的数智密码
出海 | 木蚁机器人走进上海合作组织及启德物流
《人民日报》“国产割草机器人走俏海外”-普华灵动第三代智能割草机器人：工业基因赋能下的技术突围与市场破局
智联万物·焊造未来 | 库卡重载AMR亮相埃森焊接展
中博会第三天 |富唯智能展示人形机器人创新成果，获领导关注