人形机器人的触觉与语音能力正飞速提升

机器人 时间:2026-05-08来源:

借助生成式 AI 与智能体 AI,人形机器人在执行各类任务方面取得显著进步。相关预测显示,这类系统将在未来几年深度融入人类生活。

目前,人形机器人主要用于电子与汽车工厂、仓库物流及专业清洁场景。中国预计 2026 年人形机器人产量将激增 94%。不久后,它们将进入家庭,成为老人陪护与生活助理。

楷登电子(Cadence)CEO Anirudh Devgan 表示:“机器人可能是有史以来最大的产品品类,市场规模预计达到25 万亿美元,而全球 GDP 约为 110 万亿美元。如果这一预测成真,影响将极为巨大。”

虽然人形机器人模拟人类外形,但不必完全复刻成人形态 —— 它们可以像孩童般小巧,甚至只有三根手指。各类感官与对应传感器都在研发中,进度各不相同:视觉与语言最成熟,嗅觉与味觉最落后,触觉与听觉正在快速追赶。

新思科技(Synopsys)产品营销总监 Marc Swinnen 表示:“自然语言技术发展成熟,因为它应用广泛,机器人也从中受益。视觉同样成熟,但面临与自动驾驶类似的挑战:物体识别绝非易事。触觉方面,压力传感与纹理感知已做得不错。每个研究人员都会说自己研究的感官最难,但真正难的可能是所有能力协同工作。”

所有物理 AI 相关技术都需要持续突破,包括触觉与压力感知,但AI 让机器人学习速度大幅加快。

西门子 EDA 产品负责人 Sathishkumar Balasubramanian 称:“我们一直都有传感器,能区分不同触摸并转换为数字信号,但不知道如何像人类一样工作。大模型让这一切成为可能,它可以成为‘大脑’,驱动语音识别、触觉感知、物理动作、推理与反应。”

A robotic head with sensors and a speaker, displayed in a transparent case showcasing electronic components and circuit boards.

图 视觉识别系统(英飞凌科技)

触觉:从工业机器人借鉴经验

在人形机器人手部的真实环境触觉交互方面,业界研究仍然较少,但工业机器人的末端执行器已有广泛应用。

新谱思(Synaptics)高级产品营销经理 Sam Toba 表示:“工业机械臂的应用范围非常广,相关技术可以平移到人形机器人。”

另一快速发展的领域是语音识别与对话,无论是机器人通过大模型与人交流,还是控制家中智能设备,需求都在爆发。

Synaptics 副总裁 John Weil 指出:“语音模型能力与几年前相比,差距可能高达100 倍。”

德州仪器(TI)机器人与工业自动化总经理 Giovanni Campanella 认为:触觉与听觉是最具挑战性的感官。相机原理易于理解,生态成熟;但听觉与触觉的研究与资料极少,却是客户最关注、最想突破的方向。厂商正从单纯搭载相机,转向增加多类感官让机器人更智能。

英飞凌功率与传感器系统总裁 Adam White 举例:中国机器人公司正在研发带视觉与 AI 的吸尘器,能识别水渍、地板材质,用 AI 建图省电、分析 dust 分布判断高频使用区域。这正是从生成式 AI 走向智能体 AI,再走向物理 AI的过程。

精度与灵巧操作:人形机器人的核心挑战

英伟达(NVIDIA)机器人与边缘 AI 副总裁 Deepu Talla 表示:“物理 AI 与机器人应用对精度要求极高,可能需要多个 9 的准确率。自动驾驶可能需要 10 个 9,手术机器人要求更高。”

简单操作包括两指抓取或吸附,但终极目标是通用化、精细灵巧操作,需要先进传感器、执行器与安全实时控制。

英伟达正与 Cadence 合作,将智能体 AI 嵌入物理 AI,结合芯片 IP 与机器人仿真库,缩小机器人 “从仿真到现实” 的差距。AI 智能体协调虚拟训练、物理模型与大规模场景仿真,解决复杂现实问题。

Imagination Technologies 产品总监 Matthew Bubis 指出:“人形机器人首先要解决极其复杂的机械问题,其次要让 AI 输出控制这些机械系统。机器人同时面临 AI 与机械两大难题,而汽车只需要解决前者。”

触觉技术详解

手部感知的核心是接触,传感器需要测量力、剪切力、滑动、温度,通常还集成惯性测量单元(IMU)。

触觉传感包括电容、压电、光学、磁学、电感、电阻等多种方案,各有优劣。

Synaptics 的 Sam Toba 表示:“传感原理相似,但连接芯片的物理传感器形态差异很大。”

所有原始数据需要聚合为有效事件。“我们的触控芯片运行机器学习算法,用于噪声检测、力度感知。电容传感的最大优势是速度极快,能快速感知滑动、剪切力,防止物体掉落。”

手掌中的 MCU/MPU 负责边缘预处理,避免过载主机 CPU。

Synaptics 战略高级总监 Nebu Philips 解释:“多类型触觉传感器的数据聚合属于传感器融合。最小的网格传感器仅5×5mm,支持 60 通道。”

TI 的 Campanella 说:“手掌可分布多达 30 个传感器,手指中磁学或电容传感器形成矩阵,可判断触摸位置与力度,并快速反馈给电机控制,形成闭环。部分方案在边缘直接处理,也可通过高速通信(千兆以上)回传给机器人大脑。”

Grinn 创始人 Robert Otręba 表示:“人形机器人不必一定是五指全手,两根手指甚至一根手指加触觉即可。我们可以把人类行为转化为机器人逻辑,用微型芯片靠近传感端做数据采集、预处理、降噪,减少长线传输干扰。”

A robotic hand holding a turquoise cylindrical object, featuring articulated fingers and a base for stability.

图片来源:Synaptics

语音与自然交互:听懂、说对、懂语境

人形机器人需要实时、自然、带合适口音地倾听与回应,但不同语言与方言带来挑战。

Synaptics 的 John Weil 表示:“语音技术在原理上不难,难点在于范围界定:用一个通用模型,还是多个本地化模型?通用模型体积大、成本高;本地化模型响应更快、体验更好。”

例如在日本,即便模型能听懂日语,用户仍会抱怨:“用词太年轻、不够礼貌。” 他们希望机器人听起来像 35 岁,而非 18 岁。

模型通常能识别俚语,本质是词语匹配 + 最近邻算法,通过检索增强生成(RAG)在数据库中匹配并输出。

语境理解是关键。机器人需要判断何时该说话、何时保持安静,区分 “对它说话” 和 “人与人对话”。

John Weil 说:“我们在 CES 展示了波束成形麦,设备不仅能听声,还能判断声源方向。当你走向设备,它已感知到更强的语境信号。”

家庭环境噪音复杂,机器人必须区分人声与噪音,识别语音来源。TI 的 Campanella 表示:“需要优秀的信号链、音频编解码器、高信噪比,搭配边缘硬件加速器,让模型在部署前就学会区分特定人声。”

结论

不同市场对机器人、人形机器人与人机接口的接受速度不同。

目前,人形机器人的普及度仍低于多关节机器人与协作机器人,主要出现在专业清洁等少数场景。

新思科技的 Matt Commens 表示:“CES 上已有大量公司尝试复刻人类行为,这需要复杂软件、多电机、多传感器与无线通信。未来几年,我们有望看到更多商用产品走进家庭做家务。”

工业 4.0 已遍布机器人,“过去人做的汽车制造工作,现在都由机器人完成。我们希望现实世界里也有像电脑里 AI 智能体一样的机器人助手,而这不仅需要软件,更需要硬件支撑。”

关键词: 人形机器人 触觉 语音能力 TI

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版