从 AI 大模型与游戏机制,探索人类部分行为的本质

type
Post
category
思维认知
tags
AI
人工智能
认知
思考
游戏
沟通
随笔
博客
NotionNext
slug
ai-llm-game-human-nature
summary
从 AI 大模型与游戏机制切入,谈人与模型如何把外界「归档」成自己;联机与单机隐喻、唯识分层与预测编码对照;人际与智能体协作里何以易误判,落脚暂停、自省与留余。
status
Published
date
May 2, 2026
icon
password

人、AI 与内化的游戏:从脑到世界的观察

每天,我们都像在玩一款既单机又联网的游戏: 外界的信息像信号流入我们的感官,我们的思维系统像操作系统处理这些信号,底层习惯和长期经验像硬盘里沉积的“种子”,而自我叙事不断二次加工、修正、加固,塑造我们看到的世界和做出的选择。 人脑的处理方式与 AI 大模型惊人相似:都有预训练、有微调、有反馈机制,有的部分固执执念,有的部分能够修正更新。佛学唯识、脑科学预测编码、生活经验、AI 类比、游戏比喻,这些都只是不同语言描述同一件事——我们如何感知、内化、判断,以及如何在有限视角里尽量看清世界,同时保持余地与灵活。

一、人和 AI:同一件事的不同语言

在我看来,人和 AI 大模型,本质上是类似的系统:不断把外界输入内化自己。外界的文字、声音、图像、触觉、嗅觉,经过内化,会变成我们信仰什么、害怕什么、如何预测下一步行动的底层依据。佛学称之为熏习与种子,脑科学谈预测与可塑,工程中则称训练与权重。
如果把人比作一台计算机:
  • 遗传与早期环境,就像出厂自带的操作系统——每个人继承的基础不同,默认偏好也不同。
  • 成长经历,像不断打补丁、安装软件——有人长期遇到强反馈、高纠错环境,有人一直在狭窄环境循环,更新频率和软件质量迥异。
  • 读过的书、创过的业、爱过的人、熬过的夜,则是灌进来的数据集——这些经历汇成独一无二的记忆和倾向。
于是,每个人都像一套独立训练出来、会走路会生气的「大模型归档」。我们对外界刺激的第一反应,往往不是理性选择,而是系统里最省力的惯性条件发射。大模型有“数据—偏好—输出”,脑科学讲“预测—误差—叙事”,佛家唯识盯“执”与“我执”。
从这个视角看,人类文明——生物、文化与语言的叠加——或许就像某种高阶智能的“实验场”,而我们每个人的自我,也可能只是这片实验场里的复杂“营养基”。
当我们把分析 AI 的方法套到自身上,居高临下的清醒也未必免疫于局内人的盲点。人类在训练 AI 或制造机器人时,也终于体验了一把造物主的感受。

二、生活越来越像游戏

我们常说“人生像网游还是单机”,其实两种说法各有道理。从单机的角度看,世界像是根据你的感官和思维运行的一套本地程序:眼睛耳朵收集信号,你的大脑操作系统和安装的软件处理这些信息,再写入个人存档,而周围的人仿佛是无操控的 NPC,各自遵循自己的程序运行。你看到的行为、听到的话、感受到的情绪,都是自己系统里加工后的结果。
但从联网的角度看,其他人是真实存在的智能体,他们在独立的硬件和滤镜下操作,也在影响着世界。信息在流动,互动并非单向,你与他人的连接犹如服务器与客户端的交换,只是大家没有共享同一个硬件。
在佛学唯识里,有一层说法非常贴切:表面看似联机,深处却像多个智能体隔着界面间接交流。你看到的是行为和角色,背后的操作、谁在注视、谁在调整,并非完全透明。人与 AI 协作时的场景也类似——各个模型通过接口对话,而不是两个人裸眼盯着同一块屏幕。
于是,每个人都可能在某一刻像脚本里的 NPC,又可能在另一瞬间被更深的觉察“接管操作”。差别不在于能力,而在于你是否愿意从 autopilot(自动驾驶模式)里伸手调整参数。长期托管、只靠应激、很少反观自省时,旁人就容易觉得你的下一步动作永远可预测
💡
你可以把自己看作同时拥有两套操作系统:快系统负责自动处理、反应迅速,慢系统则需要唤醒才能上线,负责深度思考和自我调控。
生活的联机感与单机感并不矛盾。人既非全时清醒的玩家,也非永远盯屏的 NPC——我们每个人都在两种状态间游走,有时像自动驾驶,有时突然上线。

三、古法脑科学:意识的分层与自我叙事

如果说第二章讲了我们如何在“生活游戏”里感知 NPC 与玩家状态,那么接下来要看的是:这套操作系统背后,到底有什么在运作
佛学是一种古法科学,唯识把心识粗略分层,帮助我们理解:我们的大脑和行为是如何从感官输入到深层自我叙事逐层加工的。
  • 前五识(眼、耳、鼻、舌、身):像传感器,负责接收外界信号,不直接判断对错或道德。
  • 第六意识:负责思考、抉择和情绪标签,接近日常说的“动脑筋”。
  • 第七末那识:维护**“我是谁、别人和世界该怎么安放我”的自我故事;在现代脑科学里,它与默认模式网络**中自我参照加工相似。
  • 第八阿赖耶识:不要把它理解为硬盘,而是藏**“种子”——我们的习气、倾向逐层沉积,是长期归档**的深层结构。
换句话说,我们在世上操作的身体和感知系统,可以理解为色身——在叙事结构里,是被放进环境中的会动载体:它与其他“角色”交换信号,但并非每一刻背后都有清醒的“玩家”。
为了更直观地理解佛学术语与现代认知科学的对照,可以参考下表:
你大概在体验什么
佛学传统里常用称呼
AI / 脑科学术语
看、听
前五识
传感与输入、多模态信号
思考、判断、贴情绪标签
第六意识
工作记忆、注意力、任务规划
“我是谁”“别人该怎么对我”
末那识
自我模型、人设、默认模式网络中的自我叙事
老习惯、老倾向,越长越像你的那部分
阿赖耶识(习气/种子)
长时先验、由历史与数据形成的隐偏好
顽固、只信自己的版本
我执、遍计所执(大意)
过拟合、拒绝对反例更新叙事
偶尔停下来反观自己
(不一一列)
人类在环、元认知、复盘

四、人脑的工作流程:先结论,再圆理由

人脑常常先下判断,再找理由圆回来——这才是大多数时候的真实操作模式。
很多传统智慧和现代认知研究都指向同一粗略结构:人并非永远先看清事实再判断,而是心里先有故事,再用感官和推理把剧情圆上
  • 佛学里对应所知障
  • 认知科学里对应预测编码
  • 白话理解就是:戴着有色眼镜看世界
人与人操作系统的差别,不在智商,而在于是否允许误差进入心里——这种对已有信念的执着,可以称作“我执”。
路线 A(我执紧一点)
路线 B(我执松一点)
新信息与旧故事
不合,就当没听见或怪对方
不合,先愣一下:要不要改我心里那句
口头表现
否认、跳过、抬高声音
「这一点我再看看」
长期效果
叙事边界越筑越高
偶尔能写入经验里
人往往趋向顽固,这既是操作系统的隐偏好,也是色身节能需求共同作用的结果。
💡
在历史长河中,人类真正能衣食无忧、随时吃饱饭的时间微不足道。
因此,我们的系统默认处于一种极度能量匮乏状态:上顿没下顿,节能本能在此环境下进化而来。
当新信息进入系统:
  • 与旧预期一致:大脑会说「你看我说过吧」,滤镜加固。
  • 与旧预期不符:张力出现——
    • “我执”紧的人,会否认、跳过、甚至攻击,阻止矛盾进入;
    • “我执”松的人,会愣一下:「这有意思」,愿意考虑。
无论哪种反应,都回馈入自我叙事,影响行为。长期下来,这种循环会沉积成深层习气。极粗略地说,我执就像是否允许把误差写回底层系统——是否愿意更新自己的“软件版本”。

新信息处理流程

人脑虽不能完全等同于大语言模型,但可以用下图理解粗流程:
可以把执念理解为:一次次选择「不听、不认、不改」,旧版本就越焊越牢。

人脑 vs 大模型

  1. 预训练:像人在大环境中成长,先验已经形成,“默认顺口”模式上线。
  1. 微调 / 对齐 / 人类反馈:小规模、有方向的数据把行为拉向某边——像社会、家庭通过奖惩改写你的对外人设。
  1. 误差是否能改写:理想情况减少错误;数据偏、目标单一则会过拟合——像人只听自己的版本,路越走越窄。
  1. 人类在环:在系统中改 prompt、加工具或审核,相当于给误差反馈开了更多口——不是模型更“道德”,而是系统是否允许松动
模型和人一样:有的固执、有的会“修行”。不同大模型的使用体验类似人与人的交流:有的聪明、善解人意、逻辑清晰;有的听不懂、表达奇怪,甚至偷懒或狡辩。
 
从脑科学和佛学角度看,人脑的工作模式其实有迹可循:
  • 脑科学告诉我们,默认模式网络控制着自述、走神、内在叙事,而预测编码机制负责处理预期与现实不符时的冲突
  • 佛学说,人容易把脑子里的“地图”当作整个世界——也就是我们以为看到的全貌,其实是自己习惯性画出来的片段。
换成大白话说,就是:我们看到的世界,往往只是一部分,是脑子自己拼凑出来的故事。比如你觉得某个人“总是这样”,可能不是全貌,而是你的大脑只抓住了那些印象深刻的瞬间,然后填补空白,形成习惯性的叙事。
所以,要理解自己,不妨问自己:
“我现在看到的这个事实,有多少是真的?多少只是我脑子习惯拼出来的故事?”
这个思路不仅适用于自我觉察,也适用于和别人、智能体的互动:他们的行为和反应,你看到的只是输出,你永远无法直接看到内部“处理器”。人或模型都有自己的默认模式,理解这一点,才能让你更容易接受新的信息,把误差真正写回系统,而不是死守旧版本。

五、别人看到的世界和你不一样

粗略来说,人类共享相近的感官和神经基础,就像同类硬件跑出来的大致相同画面;但再往上,每个人的自我叙事会进行二次加工,同一场景里各自注意到的“关键点”可能完全不同
举个例子:一条极限运动少年的短视频。有人看到的是活力与热血,有人注意到安全制度与保护措施,有人看文化差异,有人觉得是反讽段子——像素相同,剧情却分叉。这不就是日常版的“罗生门”吗?
因此,如果人与人交流时,总把对方当成 NPC(只看输出、不看思考过程),对话很容易变成立场宣示,而不是事实核对。人的观点本身带有惯性,所以我有时会先问自己或别人:
「你第一眼注意到画面哪一块?」
往往比多堆几句反驳更有效。真理未必丢了,只是大家关注的截图范围不同——而这个差异,就是我们常常误以为世界不客观的原因。

六、其实“我”并不完全掌控自己讲的故事

同一条视频、同一件事情,不同人能看出完全不一样的剧情。但在试图看透别人之前,我们常常忘了一点:我们心里的故事,并不是完全由现在这个“我”自己写的
底层其实早就写好了:习惯、性格、成长经历、身体状态、语言环境……就像一支看不见的手在帮你写剧本。
认知科学也会问:我们所谓“自主选择”,其实能控制多少?
佛学说无常、因缘、众生皆苦——这里的“苦”,不仅是难过,而是每个人都有盲区,没有一键全景。换句话说,这不是谁笨谁聪明,而是每个人都有看不见的限制,你我都在环境和习惯里被训练着。
更微妙的是:当我们说自己在改变、在修行,其实有时候只是换了个故事包装自己。原来追名逐利,现在追“修行人设”或标签优越,核心没变——还是“我必须显得比别人特别”。换了皮肤的执着,比以前更隐蔽,但仍在左右行为。

七、动之前,先停一停

我们的身体和心智大部分时间都在自动驾驶:肉色的皮囊按惯性行动,很多行为无人实时监督。面对世界,我们很少是真正“上线”的玩家。
先看见局限——软硬件与习气缠在一起,谁都不是全知视角。意识到这一点,就是渐悟的起点。
动之前先停一停——就像游戏里有人说:“玩家上线先看一眼”,先确认:角色卡住没、叙事抢戏没,再决定要不要跟冲动走。多一息,可能就能改变下游整条河的走向。
长远——试着减轻“自我故事”对每次误差的霸权式否决,让感官少扛那么多“必须赢”的解释。如果借用“无我”,这里只取少为“我永远正确”付攻击性这一层意思,不冒充佛学全套。
渐悟常是把心扩容:多读、多见,让视角慢慢对上号,不是一上来就删光自我故事,而是先把碗口做大
顿悟可能来自长期积累突然贯通,或被现实撞得旧叙事圆不上——后者若承受不住,也可能与心理危机缠绕,务必寻求专业支持
「允许一切发生」去掉油腻,就是:少和既成事实硬拗,省下心力去动还能动的部分。它不同于放弃——放弃里常暗藏消极对抗;允许更接近先关掉空转内耗

八、暂停、自省、留余地

当意识上线时,你可以用三个动作调整状态。
暂停:情绪激动时先推迟反应,很多冲突自然落潮。
(提示:你操控的皮囊很多时候自动驾驶,先停一停能避免冲动上线,减少不必要的损耗。)
自省:我也会脑补、护短,不必在每段关系里都抢裁判席。带人、与模型互动,也不该默认盲区全在对岸。换句话说:不是别人有问题,而是双方都可能有“自动驾驶”状态。
留余地:多说「我不太确定」「这点我要再了解」,给反例留一道缝。不要把自己和世界都锁死在单一故事里。
当自我故事的弦略微松开,同一条路、一餐饭,往往会多出风、光、声、味——古人说“咸有咸味,淡有淡味”,可以理解为:少用立场去“吃”经验,多回到感官本身;“一花一世界”落地,也不过是心里的分辨率粗略提高了一点点
理解自己和他人的入口很多:游戏、智能体、读经论、心理工作、亲密关系,甚至摔过一跤,不必分优先顺序。我自己有时也会不满足于某本书的最终解释,把脑科学、模型原理和古籍在笔记里各写一栏——“慢点下判词”“给反例留缝”,两句仍放在桌角,写完就存档
最后一次骂谁“蠢”、骂谁“人品不行”,或用“NPC”概括谁时,如果能多加三条具体信息,判断会不会松动一点?
对下属、对模型,我都这么问自己:有没有哪件事材料差不多、故事却两岔,后来对上了没有?
在“暂停、自省、留余地”里,哪一条先试一周最容易落地?
对自己同样适用:少做一次仓促驳回,多留一指宽的灰,往往更省力,也更走得远。
 

最后

熟能生巧、厚积薄发、水到渠成。
我们终其一生的修为,本质上就是在打磨自己的底层操作系统——这套系统承载着我们的习惯反应、直觉判断和决策机制,让它日益完善、稳定而高效。随着时间推移,它能够在无需刻意上线、无需每一次都高度集中的情况下,仅靠日常养成的习惯和沉淀的经验,就自然完成复杂的博弈与高难度操作。就像台上一分钟,台下十年功;养兵千日,用兵一时,系统的积累和打磨,让我们在关键时刻游刃有余,而无需费力。
无论是做系统、写软件、经营公司,还是做人、投资、短线博弈、打游戏,核心都是同样的逻辑:不断复盘、迭代、调整。从最初的“连自己都不知道自己不知道”,到“知道自己不知道”,再到“知道自己知道”,最终达到“无需刻意努力就能自如应对”。每一次实践与沉淀,都是对系统的优化,也是认知的自然阶梯式提升——潜移默化,却有明显的层级差距。这个过程决定了能力、洞察力和判断力的分层,也就是所谓阶级分明的认知差距:早一步打磨系统的人,自然在应对复杂局面时轻松自如;后一步的人,还在拼力追赶。
到达这一阶段,你会发现——曾经费力的判断和博弈,现在可以顺畅自然地完成,而剩下的,就是真正的尽人事、听天命,把不可控的运气留给天命。归根结底,人生的修炼,就是让底层系统承载复杂、承载高难度,把精力留给真正可控的部分。一切显得轻松自然,但背后是日积月累的修为和认知提升,是阶梯式成长带来的从容与自在。
作者:NotionNext
声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。

Previous

佛学宇宙观:我理解的“三千大千世界”

Next

短线交易的核心:用仓位去"跟随趋势",而不是"预测涨跌"

评论