人工智能真的能学会“读心术”吗？如果可以，怎么做？

2009 年 9 月 12 日

全文共 3297 字，预计学习时长 10 分钟

图源：Unsplash

会“读心术”的人工智能，我们在科幻电影里司空见惯。如果运用到现实中……

不少人都会摆摆手，表示反乌托邦未来的情节还是去电影里实现吧。

的确，让人工智能可以读懂思想的难度不小啊。

但，也不是不可能的。

特别是随着现代科技的进步，这项技术正以跨越式的速度从科幻情节变为科学事实。

AI读懂思想乃大势所趋

在诸如人机交互和心理保健等多个领域中，自动无创的大脑活动检测或许都大有用处。它可以提供用户与设备之间交互的额外维度，还可以导出不依赖于口头交流的实物信息。

这样的创新也意味着更好的脑机接口。这将为人机交流开辟全新的平台，包括为患有身体或精神疾病的人提供支持。脑机接口可以让瘫痪的人移动机械臂，或者使脊髓受伤的人控制电动轮椅。

随着人们越来越容易获取低成本的脑电图（EEG）设备，消费行业和研究机构能够负担脑电波数据的成本，进而产生了用自动分类取代人类专家的需求。

本文将介绍一个案例,以说明如何用机器学习来分析大脑活动。通过使用市售设备的脑电图记录，文章将介绍如何使用机器学习模型来预测受试者的相应心理状态。

图源：Unsplash

机器学习如何进行心理状态分类

除非记录人隶属于执行此类实验的实验室，否则记录高质量的脑电图数据并非一帆风顺。但是，小芯最近看到了一篇有趣的文章，是由约旦·伯德，路易斯·曼索、爱德华多·里比耶罗、阿尼科·埃卡特和迭戈·R·法里亚共同撰写的《关于使用基于脑电图的脑机接口进行心理状态分类的研究》。幸运的是，他们已经公开分享了研究中使用的数据，以供其他人进行实验使用。在小芯看来特别有趣的是，在亚马逊上只需花几百美元便可下单使用消费级设备。他们的研究中所用的记录和处理数据的方法将在以下部分介绍。

实验细节

该研究利用了市售的 MUSE牌脑电图头带使用了四个干颅外电极。这是一种可穿戴式的大脑感应设备，可通过4个脑电图（EEG）传感器测量大脑活动。

为了唤起不同的心理状态，实验利用了下表所示的一系列电影片段，分别代表积极效价和消极效价。

来源：为了EEG脑波数据收集而作为刺激的影片片段

针对表中的每一个影片片段，分别记录两名实验对象（1名男性，1名女性，年龄在20-22岁）60秒的数据，从而产生12分钟的大脑活动数据（每种情绪状态对应6分钟的数据）。另外还收集了六分钟的中性脑电波数据，从而产生从实验对象身上记录的总共多达36分钟的脑电图数据。（每天收集三分钟的数据，以减少静息情绪状态的干扰）。通过将可变频率重新采样到150Hz，可以产生一个容量为324,000个数据点的数据集。

脑电图信号特征的初步设置

特征提取和脑电图信号分类是脑机接口(BCI) 应用的核心问题。脑电图特征提取的挑战之一是信号的复杂性，因为它实际上是非线性的，不平稳的，并且是随意的。只有在极短的间隔之间，才认为信号是稳定的。这就是应用短时开窗技术以满足所需是最佳实践的原因。然而，仍认为它是一个在正常大脑条件下成立的假设。

来源：四个Muse传感器的实时脑电图(EEG)流的实例，Right AUX无设备，并且由于只是噪音，无需考虑。这个实时反馈图在每个传感器的t=0处有一个测得的微伏特y轴，以及一个详细显示时间读数的x。

这一部分展示了特征设置，这些特征被认为可以恰当区分心理状态的不同类别。这些特征依赖于统计学技术、基于快速傅里叶变换的时频分析、信息熵、时间序列的最大-最小特征等。根据给定时间窗口中信号的时间分布，所有初步用来对心理状态进行分类的特征都将进行计算。定义该滑动窗口的时间段为1秒，即所有特征都在这个时间点上进行计算。

机器学习算法

接着以上从原始脑电图数据中进行特征提取的方法，现在有了一个包含2547个特征的数据集。针对数据集的每一行，都有对应的目标变量： “中性”、“消极”或“积极”。实验目标为基于这组特征训练机器学习模型，从而成功预测相应的心理状态。

此样例从随机森林分类这一“go-to”算法开始，因为它设置简单，具有强大的开箱即用功能，无需进行超参数调优。

此处说明一下：使用卷积神经网络方法处理原始时域数据（不是含有信号各种频率特性的已提取的特征集）也会很有趣。由于应用于时域的卷积在卷积定理中与信号的频率特性联系紧密，这很有可能是减少预处理和特征提取工作量的有效方法。

图源：Unsplash

交叉验证

在应用机器学习的过程中，首先需要明白交叉验证的重要性:在数据集的一部分上评估模型性能，这一部分需区别于用于训练模型的部分。其中一种方式就是在训练模型时保留部分数据集，并且用以下方式（示例）评估模型性能：

· 用70%已标注的数据训练模型

· 用剩下的30%评估已训练的模型

通过多次反复，观察测试结果是否因训练/测试的样本不同而不同，K-折交叉验证从而得到完善。

来源： http://karlrosaen.com/ml/learning-log/2016-06-20/

通过多次的训练/测试比对，就能够获得更好的模型性能评估和完整的检查，确认在进行了不同标注数据段的训练后，模型性能不会有很大差异，即使这些数据本身在模型中有不稳定性或样本集很小。

在本案例中，小芯在训练模型时采用了10折交叉验证，计算了在不同数据段上评估的准确性。最终模型性能可以通过以下混淆矩阵进行可视化展示。

在机器学习领域和特定的统计分类问题中，混淆矩阵，也被称为误差矩阵，是一种能够将算法进行可视化展示的特殊表单布局。矩阵的每一行都表示实际类的实例，而每一列都表示预测类的实例。其名称源于它能够轻而易举地看出系统是否混淆了不同的类（比如，错将一个类标注成了另一个类）。

混淆矩阵：真实的心理状态VS预测的心理状态

当交叉验证超过10折进行评估模型预测时，所获得的最终结果是动人的——0.987（+/-0.01）的准确率。这就说明，基于从原始脑电图数据中提取出来的特征集，对一个人的心理状态进行“中性”、“消极”或“积极”的预测，具有近99%的准确率。

通过脑电图记录预测情绪状态，尽管该实例的结果是动人的，但是为了更广泛的应用，仍有工作要做。同时，实验记录中只有两个对象的有限样本数量也产生了对新个体的普遍化问题。不过，由于样例结果前景广阔，它也成为了进一步研究的良好开端。

前景展望

这一结果是否意味着，人们正在向意念完全受控的异位科幻未来靠近？而在这一未来世界，人们甚至会失去自我想法这一隐私权。

人工智能读取人脑活动的能力引发了有关隐私权和安全性等道德问题，而主要研究人员有必要认识到这一点。技术打开了新型恶意应用的潘多拉之盒，其中包括了在操纵人脑思考敏感信息后从人脑中窃取它们。不过，该领域的突破仍然有待时日，在破解基于思考的大脑模式之路上，还需跨出重要的一步。这样的创新也意味着更好的脑机接口。这将为人机交流开辟全新的平台。脑机接口可以让瘫痪的人移动机械臂，或者使脊髓受伤的人控制电动轮椅。如下视频所示的“智能修复”等应用，是在扶助全世界残障人士的事业中迈出的一大步。

《超越仿生学》，英国卫报 (“Beyond bionics”,The Guardian)

尽管自认为是“技术乐观主义者”，小芯还是相信有必要健全该技术的法律法规，以确保这项技术真正帮助有需要的人，同时不会造成灾难性后果。

未来如何，我们无法预料。

但有一点可以肯定的是，人们正在有意或无意地寻找与计算机进行交互的方式。人工智能驱动型接口前景广阔，且充满挑战。

既然潘多拉的魔盒已经被打开，那就勇敢无畏的前进吧！

推荐阅读专题

留言点赞发个朋友圈

我们一起分享AI学习与发展的干货

编译组：鲍歆祎、刘维杰

M	T	W	T	F	S	S
« Jan
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

演道网

人工智能真的能学会“读心术”吗？如果可以，怎么做？

AI读懂思想乃大势所趋

机器学习如何进行心理状态分类

实验细节

脑电图信号特征的初步设置

机器学习算法

前景展望

About The Author

peace

AI读懂思想乃大势所趋

机器学习如何进行心理状态分类

实验细节

脑电图信号特征的初步设置

机器学习算法

前景展望

Related Posts

About The Author

peace