達特茅斯學院的研究人員已經(jīng)建立了一個人工智能模型,用于使用 Reddit 上的對話檢測精神障礙,這是新興的篩查工具浪潮的一部分,這些工具使用計算機分析社交媒體帖子并深入了解人們的精神狀態(tài)。
新模型的不同之處在于關注情緒,而不是分析的社交媒體文本的具體內(nèi)容。在 第20 屆 Web 智能和智能代理技術國際會議 (PDF) 上發(fā)表的一篇論文中 ,研究人員表明,無論帖子中討論的主題如何,這種方法都會隨著時間的推移表現(xiàn)得更好。
人們不為精神疾病尋求幫助的原因有很多——污名、高成本和缺乏服務是一些常見的障礙。該論文的合著者、Guarini '24 的郭曉波說,還有一種趨勢是盡量減少精神障礙的跡象或將其與壓力混為一談。他說,他們可能會在一些提示下尋求幫助,而這正是數(shù)字篩選工具可以發(fā)揮作用的地方。
“社交媒體提供了一種了解人們行為的簡便方法,”郭說。他說,這些數(shù)據(jù)是自愿和公開的,發(fā)布給其他人閱讀。
Reddit 提供龐大的用戶論壇網(wǎng)絡,是他們選擇的平臺,因為它擁有近十億活躍用戶,他們討論廣泛的話題。這些帖子和評論是公開的,研究人員可以收集可追溯到 2011 年的數(shù)據(jù)。
在他們的研究中,研究人員專注于他們所謂的情緒障礙——重度抑郁癥、焦慮癥和雙相情感障礙——以不同的情緒模式為特征。他們查看了來自自我報告患有其中一種疾病的用戶和沒有任何已知精神疾病的用戶的數(shù)據(jù)。
他們訓練他們的模型來標記用戶帖子中表達的情緒并繪制不同帖子之間的情緒轉換,因此可以將帖子標記為“快樂”、“憤怒”、“悲傷”、“恐懼”、“沒有情緒”或這些的組合。該地圖是一個矩陣,可以顯示用戶從任何一種狀態(tài)到另一種狀態(tài)的可能性有多大,例如從憤怒到?jīng)]有情緒的中性狀態(tài)。
不同的情緒障礙有自己的情緒轉變特征模式。通過為用戶創(chuàng)建情緒“指紋”并將其與情緒障礙的既定特征進行比較,該模型可以檢測到它們。為了驗證他們的結果,他們在訓練期間未使用的帖子上對其進行了測試,并表明該模型準確地預測了哪些用戶可能患有或不患有這些疾病之一。
計算機科學助理教授、另一位合著者Soroush Vosoughi說,這種方法回避了典型篩選工具遇到的一個稱為“信息泄漏”的重要問題 。他說,其他模型是圍繞審查和依賴文本內(nèi)容而建立的,雖然這些模型顯示出高性能,但它們也可能具有誤導性。
例如,如果一個模型學會將“COVID”與“悲傷”或“焦慮”聯(lián)系起來,Vosoughi 解釋說,它自然會假設一位研究和發(fā)布(相當冷靜)關于 的科學家患有抑郁癥或焦慮癥。另一方面,新模型只關注情緒,對帖子中描述的特定主題或事件一無所知。
雖然研究人員不關注干預策略,但他們希望這項工作能夠為預防指明方向。在他們的論文中,他們有力地證明了基于社交媒體數(shù)據(jù)對模型進行更深思熟慮的審查。“擁有表現(xiàn)良好的模型非常重要,”Vosoughi 說,“但也要真正了解它們的工作原理、偏見和局限性。”