设计真正为残障人士服务的人工智能

Technology
Designing AI That Truly Serves Disabled People
一份构建人工智能的实用蓝图,旨在倾听、反映并尊重残障人士的需求——涵盖了从数据集选择到设备端设计,以及共同创作和政策保障的方方面面。

当服务演变成噱头:简述现状

2025年12月6日,身兼建筑师且有着二十年残障生活经历的 Bhavanishankar Ravindra 发表了一份简短的宣言:一份为工程师绘制的蓝图,旨在打造“映射而非营销”的人工智能。他的论点简洁而犀利:太多标榜为“无障碍”的工具只是事后补救和公关手段;当用户的言语、身体或语言偏离训练常模时,这些工具就会失效。与此同时,联合国儿童基金会(UNICEF)已在十几个国家开展无障碍数字教科书试点,而无障碍专家则警告称,业界对生成式人工智能(generative AI)的炒作正在鼓励企业接受“足够好”的自动化输出,但这可能会损害用户的尊严和独立性。

生活化的蓝图:从边缘开始

Ravindra 的核心观点也是一个设计原则:从边缘开始。残障人士并非非典型的测试案例,他们是边缘案例智能(edge-case intelligence)的源泉,能够揭示系统的崩溃点。主流人工智能将非标准语音视为“噪音”,而身患残障的开发者则将同样的信号视为“意义”。这种转变改变了一切。与其试图强迫人类适应模型的预期输入,模型必须被构建为能够接受并呈现用户自己的模式——隐喻、犹豫、节奏性言语——并将其反射回去,而不是用预设的同情心来覆盖它们。

在实践中,这意味着设计师应当嵌入诸如抗噪语音能力、对替代输入通道(眼动追踪、开关控制、辅助和替代沟通(AAC)设备)的耐受性,以及对语言进行语义而非表层解释的功能——将隐喻漂移和重复视为信号而非错误。这也意味着需要低延迟的设备端逻辑,以便在连接中断或云端访问失败时确保隐私和可靠性。

至关重要的设计与工程原则

通过访谈、非政府组织(NGO)试点和技术审查,总结出了五种可重复的工程模式:

  • 基于约束进行构建。 低内存、具备离线能力的工具迫使开发者进行严格的优先级排序:当网络消失或电量不足时,哪些功能必须运行?这些折中方案产生的是具有韧性的用户体验(UX),而非臃肿的功能堆砌。
  • 反映优于模拟。 用户需要的工具应能映射其语言和情感结构——突出模式,而非假装感同身受。映射降低了模型投射错误意图或提供居高临下的预设回复的风险。
  • 将情绪视为信号。 追踪节奏、重复和语义偏移,将其作为认知负荷或困扰的指标,并温和地将这些信息反馈给用户;在没有征得同意和缺乏上下文的情况下,不要将其转化为不透明的风险评分。
  • 可见性与控制权。 让用户看到系统听到了什么以及为什么要采取行动;为认知疲劳提供便捷的退出和休息机制,以免系统将用户困在漫长的自动化循环中。
  • 共同设计与问责制。 从第一天起就与残障组织、护理人员和多元化用户共同构建。设计决策应受制于可衡量的无障碍指标——将其视为与性能或安全目标同等重要的指标。

数据、设备与隐私的权衡

包容性模型需要包容性数据。这既显而易见又困难重重。大多数语音和视觉模型是在常态化语料库(清晰的语音、无遮挡的面部、标准布局)上训练的。虽然像 Mozilla 的 Common Voice 和 Project Euphonia 这样的项目旨在吸纳代表性不足的声音,但其采用率仍不全面且进展缓慢。依赖于抓取的、有偏见的数据集的公司将继续生产脆弱的系统。

两个技术权衡值得强调。首先是设备端推理:在本地运行更小、经过良好调优的模型可以减少延迟、保护隐私,并允许用户在没有互联网连接的情况下进行交互——这对于许多残障用户以及连接不稳定的地区的教育部署至关重要。其次是模型选择:最大的基础模型并不总是合适的工具。推理和演化往往受益于紧凑、可解释的模型,这些模型可以被审计并受到约束,以反映用户的意图而不产生幻觉。

标准、衡量与系统性变革

无障碍功能往往仍被视为一种附加组件。Built In 的无障碍审查和 UNICEF 的教科书试点都指向了相同的结构性修复:无障碍必须成为一个可衡量的成功指标和强制性标准——类似于 Web 领域的 WCAG,但应用于人工智能的行为和界面。这需要三个方面的协调:人工智能无障碍的通用标准、在整个产品周期中例行纳入残障合作者,以及奖励包容性设计的监管或采购杠杆。

衡量至关重要。除了统计“制作的无障碍文本”数量外,更有意义的指标是学习成果、参与率、留存率、报告的尊严感以及认知负荷的减轻。追踪这些信号的系统可以迭代得更快;而只追踪下载量或点击量的系统则做不到。

经济与劳动力影响

设计包容性人工智能不能忽视劳动力问题。在各行各业,我们都看到人工智能被用来为“去技能化”和降薪正名。翻译是一个清晰的例子:翻译人员被机器翻译流程推向了低薪的后期编辑角色,即便这些流程降低了质量并牺牲了用户的文化细微差别。类似的动态也可能出现在无障碍领域:如果公司用缺乏监管的机器人取代经过培训的人类沟通者、治疗师或专业教育者,社会危害将会加剧。

因此,负责任的产业战略应将包容性产品设计与劳动力转型相结合:重新培训教育者和无障碍专家,使其能够操作、审计和策划无障碍人工智能;资助社区主导的数据集收集;并保护那些确保质量、上下文和人类监督的有偿岗位。

开发者实践路线图

工程师或产品负责人明天可以做些什么?

  1. 邀请残障合作者进入核心团队。 给他们报酬并赋予决策权,而不仅仅是测试名额。
  2. 优先考虑包容性数据集。 为收集多元化语音、视觉和交互踪迹的项目(例如低资源、带口音、非标准语音数据集)做出贡献或从其获得授权。
  3. 设定无障碍关键绩效指标(KPI)。 追踪定性和定量指标:疲劳状态下的任务成功率、非标准输入的错误率、感知尊严和自主性。
  4. 在适当情况下选择小型、可审计的模型。 对于私密、低延迟的无障碍任务,最大的模型很少是最好的。
  5. 设计退出和休息流程。 预设认知负荷的存在,并为用户提供暂停、导出或将对话移交给信任的人类的工具。
  6. 倡导采购标准和监管。 如果公共采购者要求无障碍的人工智能,市场就会跟进。

结论:见证而非取代的工具

如果人工智能要对残障人士产生用处,它必须做好目前大多数系统做不到的两件事:它必须将用户的语言和脆弱性映射回他们自身,并且必须在保护隐私和尊严的约束下运行。这需要开发者保持谦逊——这不仅是技术上的转变,也是观念上的转变:资助者、产品团队和监管机构需要将包容性置于最新的模型基准测试之上。

蓝图很简单但要求很高:与生活在边缘的人共同设计,投资于包容性数据,为低资源和离线操作而构建,衡量真实的无障碍成果,并保护那些将人工智能转化为人道关怀的工作岗位。从这里开始,人工智能就能不再是一个噱头,而开始成为真正实现独立的工具。

来源

  • UNICEF(无障碍数字教科书倡议)
  • OpenAI(生成模型与部署研究)
  • Mozilla(Common Voice 数据集与包容性数据工作)
  • Project Euphonia(针对非典型语音的语音数据集)
  • Massachusetts Institute of Technology(人工智能研究与人机交互文献)
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Ravindra 针对残障用户的 AI 提出了什么核心设计原则?
A Ravindra 主张从“边缘”开始设计:将残障人士视为“边缘情况智能”的来源,而非非典型的测试用例。模型应当接受并向用户反馈他们的模式——如隐喻、犹豫、节奏性言语——而不是用机械化的共情来取代它们,同时支持带噪声的语音、替代输入方式以及端侧隐私保护。
Q 文中提到了哪五种可重复的工程模式?
A 这五种模式分别是:基于约束构建(Build from constraint),优先考虑核心功能以确保离线可用;反射而非模拟(Reflection over simulation),提供镜像语言和情感的工具,而非模拟感受;情感即信号(Emotion as signal),将节奏、重复和偏移视为认知负荷的指标,并向用户进行适当披露;可见性与控制(Visibility and control),展示系统捕捉到的内容并提供简便的退出机制;共同设计与问责(Co‑design and accountability),从第一天起就与残障群体开展合作。
Q 为实现包容性 AI,文章强调了哪两个数据和模型权衡?
A 包容性 AI 设计中存在两个主要的权衡:端侧推理和模型选择。端侧推理在本地使用经过良好调优的小型模型,以降低延迟、保护隐私并在连接中断时维持功能。其次,最大的基础模型并不总是最好的;紧凑、可解释的模型可以接受审计并受到约束,从而在不产生幻觉的情况下反映用户意图。
Q 根据文章内容,应如何衡量和标准化可访问性?
A 可访问性应当作为一个可衡量的成功指标,并配以协调的标准和激励措施。文章呼吁建立通用的 AI 可访问性标准,在产品周期中常规化地纳入残障合作者,并利用监管或采购手段奖励包容性设计(类似于网页的 WCAG 标准)。有意义的指标包括学习成果、参与度、留存率、感知的尊严以及认知负荷的减轻。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!