经过近十年的可穿戴设备测试,我积累了海量的健康和健身数据。虽然我乐于仔细研究我的日常数据,但有一部分我愈发厌恶:AI生成的摘要。
在过去两年中,各种健身、健康和可穿戴应用中纷纷涌现出大量AI生成的摘要功能。像Strava推出的Athlete Intelligence,宣称可以将原始锻炼数据转换为“简单易懂”的语言。Whoop则推出了Whoop Coach,一个AI聊天机器人,每天为用户提供“每日展望”报告,总结天气、近期活动和恢复指标,甚至给出锻炼建议。Oura也增加了Oura Advisor,另一个聊天机器人,能够总结数据并提取长期趋势。就连我的床垫每天早上都会向我汇报它的AI如何帮助我保持睡眠。
各个平台的AI都有其特点,但典型的早晨摘要大致是这样的:
“早上好!您昨晚睡了7小时,静息心率为60 bpm。这与您的每周平均水平相符,但稍微升高的心率表明您可能恢复不完全。如果您感到疲倦,今晚尽量早些入睡。健康的关键在于平衡!”
这看似有帮助,但这些摘要通常与图表并列,用户可以直接查看相同的数据。对于锻炼表现更是如此。以下是Strava的Athlete Intelligence针对我最近一次跑步生成的摘要:
“激烈的跑步,心率区间较高,进入了无氧区域,相对努力水平远高于您的典型范围。”
谢谢?我可以要求Athlete Intelligence“展开讨论”,但它又重复我努力程度、心率区间和配速等可从图形中看到的指标。如果您对我的运动历史或这次跑步的环境一无所知,这个摘要可能听起来有些深刻。然而,摘要忽略了最重要的信息:
我在这一年的第二次跑步中,就在高温、高湿的环境下,将里程提高了三倍,这无疑是危险的。回想过去两个月的运动历史,我的表现还远不及之前的六个月。我不得不提前结束这次跑步,因为我摔倒了,手部和膝盖都受了伤。Strava有我上传的可怕伤口照片以及文字说明,然而,当我更新了摘要后,它只反映了结束跑步的事实。这次受伤没有对其见解产生任何影响,尽管这才是这次跑步中最重要的事情。
一个更有用的见解可能是:“您在创纪录的高温下进行跑步。尽管您维持了稳定的配速,但您有在长时间休息后迅速增加里程的坏习惯,过去五年已经导致您多次自我报告受伤。更安全的选择是在接下来的两周内保持较低的里程,以适应逐渐上升的气温。由于您受伤,恢复期间建议您进行低强度的散步。”
Runna,一个知名的跑步应用,生成的摘要则稍微实用一些。它建议我下一次跑步要“轻松”进行,这对我来说是个合理的补充。抱歉,但48小时对于我的膝盖来说并不足以安全愈合,以免伤口再次裂开。
应用内的聊天机器人表现也差强人意。昨天早上,我问Whoop Coach我是否应该今天跑步,因为我在上次跑步中受伤了。它回答我:“Whoop无法回复您发送的信息。请尝试发送不同的信息。”我尝试重新表述我的问题,告诉它:“我受伤了,走路时有点跛,生成一个低强度的替代锻炼方案。”结果我是被提示联系Whoop会员服务以继续对话。
Oura Advisor的表现稍微好些,在我的日常摘要中提到:“由于您的准备值下降,以及近期的压力因素如高温、受伤和血糖升高,您今天的身体可能比平时更加疲惫。”它建议我优先考虑休息。当我询问“在膝盖受伤和轻微跛行时,什么运动是可以的?”时,它给出了常识性的答案,如如果不疼痛,可以进行短途轻松散步、轻微拉伸,并提醒我要在感到任何尖锐不适时彻底休息。虽然这接近理想的回应,但我必须引导其回答我想要的信息。这些见解过于普遍,能对自我量化的新手有所帮助,但即使这样,也仅限于那些对谷歌搜索过敏的用户。
我糟糕的跑步体验正是科技公司CEO所说的AI见解最有用的场合。理论上,我同意!拥有一个能够对我提更细致问题的聊天机器人将是多么美好。
例如,我这个月的睡眠规律一直不规律。我问Oura Advisor我的睡眠和准备趋势是否显示受伤风险上升。也询问我这个月是否有异常的睡眠负债。在这两种情况下,它都回答我没有。它说我正在改善。
结果是,与一个聊天机器人进行了长达一小时的辩论,让我开始怀疑自己的切身体会。当我试图询问本月早些时候的一周特别有压力时,它则告诉我:“其见解仅限于您最近一周和当前趋势。”这实际上违背了我拥有六年Oura数据的意义。
经过几个月在Reddit和其他社区论坛上的探讨,我知道我并不是唯一一个觉得这些AI功能可笑的人。然而,Oura的首席产品官Holly Shelton告诉我,Oura Advisor的反馈“极其积极”,有60%的用户每周使用多次,20%的用户每日使用。“不仅仅是频率,”Shelton表示,“它实际上带来了影响:60%的人表示Advisor帮助他们更好地理解之前感到困惑的指标或健康概念。”
与此同时,Strava的发言人Brian Bell表示,Athlete Intelligence的意图是帮助初学者运动员,并且“该功能的反馈仍然强劲”,大约“80%的选择反馈的人发现该功能对他们‘非常有帮助’或‘有帮助’。”
一位Whoop发言人未能在发表时做出回应。
这些毫无灵魂的摘要?多半是为了在速度、成本、有效性、数据隐私和法律责任之间达成的最佳妥协。
我明白我的沮丧源于大语言模型固有的局限性以及私人健康数据的复杂性。虽然Strava可能是一个事实上的健身数据中心,但它缺乏提供整体、有用且个性化见解所需的所有健康数据点。Oura Advisor整理一年的睡眠数据以找出趋势需要时间,而这种延迟必然会导致糟糕的用户体验。更不必说,若要添加这种计算能力,他们可能不得不将订阅费用从每月5.99美元提高。我不确定,但Whoop Coach可能由于担心责任问题而未能回应我关于伤情的询问,担心我在跟随建议时发生不测。这种毫无内容的摘要,可能是速度、成本、有效性、数据隐私和法律责任之间的最佳妥协。
但如果是这样,那我们就坦诚一点。当前的AI功能只不过是数据的重新包装,类似一个四年级学生依赖维基百科摘要而不愿阅读书籍所写的书面报告。这是一个在风潮中附加的功能,似乎在梦想中成立,因为AI正是当下的流行趋势。也许有一天,这些AI见解能创造出有用和个性化的体验,给出可操作的见解。但今天并不是那一天,而这并不值得额外付费。
图片源于:theverge