标签

AI如何洞察对话中的情绪

发布时间:2026-05-09 13:38来源:微信阅读:6

某日与友通话,挂断后友人感叹,若能录下刚才的对话就好了,以免遗忘要点。巧合的是,我的通话恰好自动录音并转录,便将文本发送给Claude Code(接deepseek-v4-pro)进行整理。

由此联想到,何不一并整理手机中自动保存的历年通话录音,以此回顾我近几年的心境变化。

早期的录音并未自动转录,常用飞书的我灵机一动,将录音上传至飞书妙记,转录效果令人满意,但飞书妙记的语音转文字时长消耗得很快。

于是我与Claude Code商讨,是否有快速批量转录的途径。它推荐了三个方案:飞书妙记、通义听悟、本地whisper。本地工具暂不考虑,通义听悟我曾用过且尚有余额,但试用后发现效果不及飞书妙记,遂放弃。

最终,我不得不转向尝试方案三:本地whisper。Claude Code接到指令后迅速行动,缺什么补什么,安装完成后开始测试一段录音。那是一段2023年底的通话,当时我临近订婚,与朋友谈论此事。Claude Code通过本地工具转录后向我汇报结果,其中包含一段内容摘要:提及你当时男友家提亲、你母亲及亲戚在场、堂姐插手提条件等,情绪颇为激动。

“情绪颇为激动”这几个字瞬间吸引了我的注意,我好奇它是从录音中听出来的,还是仅仅从转录的文本中解读出来的?当我初次将通话转录文本输入AI进行分析时,我就在思考,现实世界中的对话,除了文字本身,还蕴含着海量的信息,说话人的语调、表情、肢体动作等,都可能影响听者对文本的理解。当对话剥离了这些信息,只剩下文本,那么对话的完整信息就已经失真了。然而,AI目前的能力仅限于处理文本,也只能如此。

于是我追问它:你是如何判断情绪激动的?是谁的情绪激动?

一个小插曲:

在本地工具进行转录的过程中,我第一次发现AI也会激动得写错别字😅

最后是对AI的日常调侃: