国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

用大模型測試人格/抑郁/認知模式!通過游戲劇情發展測量心理特質

人工智能 新聞
近日,清華大學的研究團隊基于大語言模型的多智能體系統,提出一種創新性的心理測量范式。

心理測量在精神健康、自我了解、和個人發展方面都發揮著重要的作用。

傳統的心理測量范式以自我報告類型的問卷為主,常常通過參與者回憶自己的日常生活行為模式或情緒狀態進行測量。

這樣的測量方式雖然高效便捷,但可能引發參與者的抗拒心理,降低被測意愿。

隨著大語言模型(LLM)的發展,很多研究發現LLM能夠展現出穩定的人格特質,模仿人類細微的情緒與認知模式,還能輔助各種各樣的社會科學仿真實驗,為教育心理學、社會心理學、文化心理學、臨床心理學、心理咨詢等諸多心理學研究領域,提供了新的研究思路。

近日,清華大學的研究團隊基于大語言模型的多智能體系統,提出一種創新性的心理測量范式

圖片

與傳統自我報告問卷不同的是,該研究為每位參與者定制化生成一個可交互的敘事類型游戲,用戶可自定義游戲的類型與主題

隨著游戲劇情的發展,參與者需要以第一人稱視角,選擇不同的決策行為,決定劇情的走向。通過分析參與者在游戲關鍵情節中的選擇,該研究可以測量其對應的心理特質。

圖片

△自我報告問卷的心理學測量范式(左)與交互敘事類游戲的心理測量范式(右)對比

該研究的貢獻主要體現在三個方面:

  • 提出一種新的心理學測量范式,將傳統問卷轉化成基于游戲的交互測量;在保證心理測量信度和效度的基礎上,提升參與者的沉浸感,改善被測體驗。
  • 為了實現游戲化的測量,該研究提出一種基于大語言模型的多智能體交互框架,名為PsychoGAT (Psychological Game AgenTs),確保了心理學測試場景的泛化性,與不同游戲設置下測量的魯棒性。
  • 通過自動化仿真評估與真人評估,在MBTI人格測試,PHQ-9抑郁測量,認知思維陷阱測試等任務上,該研究在心理測量學統計學指標和用戶體驗感指標上均展現出了顯著的優越性。

接下來,我們一起來看看該研究的細節。

PsychoGAT長啥樣?

圖片

△PsychoGAT框架示意圖

智能體交互流程:

給定一個傳統的心理學測試問卷,參與者自定義游戲類型和主題,然后由游戲設計師(Game Designer)智能體給出整體的游戲設計大綱。

然后,游戲管理員(Game Controller)智能體生成一個具體的游戲情節,在這個過程中評論員(Critic)智能體會對管理員生成內容進行多輪的審核與優化;優化完成后的游戲情節會被展現給參與者,參與者做出相應的選擇后,管理員基于此選擇推動劇情發展,按照這樣的交互過程循環。

各智能體職能詳述:

  • 游戲設計師(Game Designer):利用CoT技術,生成第一人稱敘事游戲的大綱,并保證這個故事線中所包含的情景,能夠使得參與者表現出當前測量的心理特質。

與此同時,將標準的心理學自我報告問卷,根據當前游戲故事線進行改編,使兩者的融合更為自然流暢。

  • 游戲管理員(Game Controller):將改編后的問卷,按照游戲的故事線,依次進行實例化,變成故事的情節節點,并提供可能的選項,供參與者進行選擇。

與此同時,游戲管理員將參與者的選擇返回給游戲環境,并基于參與者的選擇,控制游戲的劇情走向。為了實現游戲情節的連貫性,管理員智能體采用“記憶更新”機制。

  • 評論員(Critic):旨在對游戲管理員的生成內容進行審核與優化。

主要針對以下三個問題:

1)優化一致性:隨著游戲劇情推進,長文本問題會變得更加嚴重,使得“記憶更新”機制也無法完全保證情節一致性。

2)確保無偏性:參與者的選擇會影響游戲情節的發展,但在參與者不做出選擇之前,管理員不應該預設情節走向,即便之前的選擇中參與者體現出了明顯的傾向性。

3)改正漏缺項:對管理員生成的游戲情節進行細節審核,檢查其是否具備基礎的游戲沉浸感。

實驗及結果

圖片

△三種常見心理學測量范式的對比:傳統問卷,心理學家會談,以及該研究提出的游戲化測評。

此處提到的均為基于AI的自動化測量,特別的,心理學家會談,指目前與大語言模型結合的,由大語言模型扮演心理學家的會談范式。

實驗階段,研究人員選擇了三個常見的心理學測量任務:MBTI人格測試中的外傾性,PHQ-9抑郁檢測,以及CBT療法中前期的認知扭曲檢測。

首先,研究人員和成熟的傳統心理學問卷進行對比,旨在檢驗該研究的心理測量信度和效度。進一步,和其他三種自動化測量方法進行對比,檢驗不同測量方法的用戶體驗。

研究人員首先使用GPT-4模擬被測者,在不同的測量方法上記錄測量過程與測量結果。這些測量記錄被用于計算后續心理測量學信效度指標,以及用戶體驗感指標。

評價指標有兩個:信效度指標和用戶體驗感指標。

  • 信效度指標:心理測量學上,評價一個測量工具是否具有科學性,一般從信度(reliability)和效度(validity)兩個維度進行驗證。

在該研究中,信度的指標選擇了兩個統計學量來衡量內部一致性:Cronbach’s Alpha和Guttman’s Lambda 6;效度的指標采用皮爾森系數,分別衡量聚合效度(convergent validity)和區分效度 (discriminant validity)

  • 用戶體驗感指標,人工評估的指標包括:

1)一致性(Coherence, CH):內容邏輯是否連貫;
2)交互性(Interactivity, IA):是否對用戶的選擇有恰當且無偏的回應;
3)趣味性(Interest, INT):測量過程是否有趣;
4)沉浸感(Immersion, IM):測量過程是否讓參與者沉浸代入;
5)滿意度(Satisfaction, ST):整體測量過程的滿意度。

下面是實驗結果。

首先研究人員檢驗了該研究提出的PsychoGAT能夠作為一個合格的心理學測量工具,結果如下表所示。

圖片
△PsychoGAT的信效度檢驗結果(+通過,++良好,+++優秀)

進一步,研究人員對比了不同心理測量范式的用戶體驗感,該研究提出的游戲化測評在交互性、趣味性和沉浸感上都顯著優于其他方法:

圖片

△PsychoGAT的用戶體驗感結果,以及其他對比方法的相應結果

為了確保人工評估的有效性,研究人員計算了人工評估結果,在PsychoGAT各指標優于其他方法上的評估一致性:

圖片
△PsychoGAT的用戶體驗感指標由于對比方法在人工評估上的一致性

為了對PsychoGAT做進一步分析,研究人員首先檢驗了不同游戲場景下,游戲化測量的信效度具有很好魯棒性:

圖片

△PsychoGAT在不同游戲場景下測量信效度的魯棒性

接著,探究了每一個智能體在PsychoGAT中發揮的作用:

圖片

△PsychoGAT不同智能體的作用

最后,為了直觀呈現PsychoGAT的游戲生成內容,研究人員用詞云可視化了人格外傾性測試和抑郁測試:

圖片

△PsychoGAT在外傾性測量和抑郁測量的游戲場景生成可視化。

外傾性測試的內容主要集中在社交場景,而抑郁測試傾向于個人思維和情緒。

更多研究細節,可參考原論文。

論文鏈接:https://arxiv.org/abs/2402.12326

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-08-11 13:15:35

ChatGPTMBTIGPT-4

2009-03-17 18:01:43

服務器多核測試

2020-06-08 09:48:31

語音技能智能

2020-03-07 22:06:22

人工智能心理健康軟件

2023-11-20 22:08:49

AI角色

2023-11-03 15:28:28

AITestin云測

2024-04-15 13:51:03

模型LLMLLMs

2025-05-27 15:21:06

LLM模型AI

2021-09-22 10:17:50

iPhone心理健康蘋果

2025-08-07 12:08:06

2014-07-21 09:18:33

2023-10-07 00:14:53

2025-03-04 01:00:00

LLM架構數據訓練

2016-12-20 10:35:52

游戲測試3D測試環境

2024-08-16 16:32:29

2025-09-22 09:13:00

2019-07-25 10:19:10

2025-02-08 11:14:28

2025-09-24 18:06:33

PromptMBTI模型
點贊
收藏

51CTO技術棧公眾號

国产精品一区在线| 91国内精品| 精品美女视频| 精品小视频在线| 99久久免费精品高清特色大片| 香蕉视频免费在线播放| 红桃av在线播放| 久久综合狠狠综合久久综青草| 国产一区二区三区视频在线观看| 亚洲视频一二三区| 日本午夜精品视频在线观看 | 在线免费av网站| 99免费在线观看视频| 国产视频精品免费播放| 一区二区三区免费网站| 国产精品一二三| 亚洲一级高清| 91精品尤物| 在线观看中文| 日本在线一二三| 免费成人黄色网址| 超碰在线免费观看97| 国产精品青青草| 国产精品第一视频| 欧美激情精品久久久久久蜜臀 | 亚洲国产欧美国产第一区| 欧美日韩国产三区| 欧美最猛黑人xxxx黑人猛叫黄| 中文字幕欧美日韩| 污片在线观看一区二区| 亚洲天堂成人网| 成人美女在线观看| 日韩av一二三| 日韩视频在线一区二区三区 | 久久久人成影片免费观看| 国产男人精品视频| 色视频成人在线观看免| 91亚洲国产高清| 亚洲欧美一区二区三区| 91黄色小网站| 91免费国产视频| 久久亚洲精品成人| 欧美第一区第二区| 中文欧美字幕免费| 国产一区欧美日韩| 一区二区福利| 亚洲老妇激情| 精品久久ai电影| 亚洲黄色网址| av最新地址| www.亚洲视频.com| 欧美性做爰毛片| 中文字幕亚洲电影| 小黄鸭精品aⅴ导航网站入口| 日韩在线电影一区| 久久男人的天堂| 亚洲香蕉伊综合在人在线视看| 色综合一区二区| 中文字幕一区二区三区色视频 | 国产一区欧美一区| 国产精品免费人成网站| 亚洲精品视频在线观看网站| 成人欧美一区二区三区小说| 91首页免费视频| 国产精品主播直播| 国产高清视频一区| 波波电影院一区二区三区| 欧美日韩亚洲三区| 久久综合给合| 亚洲破处大片| 日本一区免费视频| 欧美电影免费提供在线观看| 国产精品青青草| av免费观看一区二区| www.中文字幕久久久| 北条麻妃在线视频| 18禁裸男晨勃露j毛免费观看| 99福利在线观看| 九九久久九九久久| 久久久久久久久久网| www.久久色.com| 成人18视频| 欧美新色视频| 国产精品一区二区三区四区在线观看 | 国产黄色片在线播放| 女人高潮被爽到呻吟在线观看| 日韩三级网址| 欧美日韩综合| 久久精品日产第一区二区| 奇米888四色在线精品| 国产一区福利在线| 国产成人精品免费| 成人av在线影院| 国产成人在线视频播放| 一区二区三区在线视频观看58| 亚洲精品乱码久久久久久金桔影视| 日韩午夜在线视频| 国产日本一区二区三区| 欧美日韩在线一| 黄色漫画在线免费观看| 午夜不卡影院| 精品国产乱码久久久久久樱花| 久久精品青草| 国产成人在线视频免费播放| 亚洲国产精华液网站w| 一区二区三区成人在线视频| 日韩视频免费观看高清在线视频| 在线欧美日韩国产| 欧美精品精品精品精品免费| 成人影片在线播放| 88av.com| 视频二区在线| 免费观看黄色网| 麻豆网站在线看| 国产一区久久| 欧美日韩免费在线视频| 精品日韩欧美| 黄a大片av永久免费| 精品久久福利| 蜜桃视频在线一区| 欧美一区二区三区视频免费| 亚洲免费视频播放| 欧美一级视频免费看| 亚洲涩涩在线| 日韩一区二区久久| 911精品国产一区二区在线| 日本不卡一区| 我要色综合中文字幕| 久久品道一品道久久精品| 国内精品久久久久伊人av| jizzjizz中文| 亚洲看片一区| 精品视频偷偷看在线观看| 农村妇女精品一二区| 超碰成人福利| 日韩一区欧美小说| av色综合网| 成人啊v在线| 一区二区三区四区不卡在线| 成人高清在线观看| 暖暖成人免费视频| 一区二区三区四区高清精品免费观看| 懂色一区二区三区av片| 国产粉嫩在线观看| 欧美一区二区在线视频| 日韩一本精品| 91在线一区| 日韩欧美视频一区| 男人和女人啪啪网站| 性欧美69xoxoxoxo| 日韩中文字幕在线一区| 老司机一区二区| 欧美片一区二区三区| 九九热视频在线观看| 国产馆精品极品| 欧美在线播放高清精品| 亚洲乱码国产一区三区| 野花国产精品入口| 97在线精品国自产拍中文| 欧美亚洲系列| 午夜视频一区二区| 少妇无码av无码专区在线观看 | 国产免费观看久久| 久久国产成人| 狠狠躁夜夜躁人人爽天天天天97 | 国产黄色大片在线观看| 亚洲第一在线| 亚洲国产小视频在线观看| 亚洲色精品三区二区一区| 91蜜桃臀久久一区二区| 亚洲日本青草视频在线怡红院| 91免费在线观看网站| 激情久久一区二区| 亚洲精品第1页| 欧美日本韩国一区二区三区| 日本国产欧美| 青青草av网站| 欧美日韩国产色| 97婷婷大伊香蕉精品视频| 四虎影视av| 国模套图日韩精品一区二区| 精品久久久久久久人人人人传媒 | 成人欧美一区二区三区黑人孕妇 | 欧美资源在线观看| 亚洲图片123| 欧美视频成人| 亚洲高清色综合| 日本桃色视频| 国产精品一区二区男女羞羞无遮挡 | 国产精品九色蝌蚪自拍| 丰满少妇被猛烈进入高清播放| 好吊视频一区二区三区四区| 性金发美女69hd大尺寸| 欧美电影h版| 亚洲最新av在线网站| 涩爱av色老久久精品偷偷鲁| 国产欧美日韩在线| 91好吊色国产欧美日韩在线| 日本中文字幕不卡| 成人毛片网站|