來(lái)自立陶宛考納斯工業(yè)大學(xué)(KTU)的一位年輕研究員Domantas Didziapetris創(chuàng)建了一種基于人工智能的解決方案,用于測(cè)量紐約曼哈頓的情緒氣候。在對(duì)超過(guò)36,000條推文進(jìn)行情感分析之后,他創(chuàng)建了一個(gè)量表,該量表指示居民和訪客如何評(píng)價(jià)曼哈頓不同街區(qū)的情感氣候。
紐約是世界上訪問(wèn)量最大的城市之一。根據(jù)官方數(shù)據(jù),2018年,紐約市接待了創(chuàng)紀(jì)錄的6520萬(wàn)游客,并且這一數(shù)字還在不斷增長(zhǎng)。曼哈頓是紐約市五個(gè)行政區(qū)中人口最稠密的地區(qū),人口270萬(wàn),每年吸引近1500萬(wàn)游客。
KTU建筑與土木工程學(xué)院的Domantas Didziapetris說(shuō):“曼哈頓是充滿生命的紐約市的心臟。如果不是一個(gè)從不睡覺(jué)的城市,那么有什么更好的地方來(lái)測(cè)試一種新方法呢?”
這位年輕的研究人員認(rèn)為,城市分析方法通常仍使用紙質(zhì)或在線調(diào)查。但是它們并不總是可靠的,結(jié)果可能并不代表實(shí)際情況。
“與深入的調(diào)查表相比,一眼看到社交媒體平臺(tái)可以提供對(duì)實(shí)際情況的更多洞察。此外,此處表達(dá)的觀點(diǎn)更具表達(dá)力和沖動(dòng)性,因?yàn)槿藗冊(cè)诟械阶约旱哪且豢叹蛢A向于在網(wǎng)上表達(dá)喜悅或失望收集此類數(shù)據(jù)的最佳平臺(tái)之一是Twitter,因?yàn)樗拗屏讼⒅械淖址麛?shù),很容易將數(shù)據(jù)個(gè)性化,并且一旦用戶注冊(cè)Twitter,就已經(jīng)同意共享數(shù)據(jù)。” Didziapetris解釋說(shuō)。
編寫了一些IT程序來(lái)處理數(shù)據(jù)。首先,使用Python來(lái)編譯可實(shí)時(shí)收集推文的軟件。在大約4個(gè)月的時(shí)間內(nèi),收集了超過(guò)100萬(wàn)條推文,其中65,447條具有地理坐標(biāo)。刪除來(lái)自曼哈頓以外的所有條目后,將對(duì)36,543條推文進(jìn)行進(jìn)一步分析,并按照紐約市開放數(shù)據(jù)門戶網(wǎng)站中確定的社區(qū)區(qū)域邊界進(jìn)行分類。
其次,研究人員創(chuàng)建了一個(gè)程序,用于對(duì)推文進(jìn)行情感分析??紤]了兩個(gè)標(biāo)準(zhǔn)-主觀性和極性。主觀性表示推文的實(shí)際內(nèi)容和極性(即其情感基調(diào))。這兩個(gè)條件的等級(jí)可以從-1到+1。
Didziapetris解釋說(shuō):“主觀性標(biāo)準(zhǔn)越高,輸入的可靠性就越低。極性越接近-1,則鳴叫的情感語(yǔ)調(diào)越不積極。”
情感分析結(jié)果被投影在地圖上,據(jù)這位年輕的研究人員稱,這清楚地表明了哪些社區(qū)可以說(shuō)是幸福的,哪些并不那么開心。上西區(qū)在曼哈頓的情感氣候最不利。
上西區(qū)的面積仍然太大,無(wú)法得出結(jié)論。因此,有必要指出需要審查和進(jìn)一步發(fā)展的實(shí)際位置。
為了完成此任務(wù),使用了MIT于2011年創(chuàng)建的用于城市網(wǎng)絡(luò)分析的工具包“用于ArcGIS的城市網(wǎng)絡(luò)分析工具箱”。其間的一種方法-中間性-通常用于計(jì)算和估計(jì)網(wǎng)絡(luò)中過(guò)路者的潛力。該區(qū)域越遠(yuǎn),地圖上的顏色就越暖(紅色)。
“該地區(qū)交通不便,被遺棄的地區(qū)也就更多,而這些被遺棄的地區(qū)通常更容易受到犯罪活動(dòng)的影響。經(jīng)過(guò)城市網(wǎng)絡(luò)分析,附近的區(qū)域之一看起來(lái)特別可疑-可視化后,它變成了藍(lán)色和綠色。我從該地區(qū)收到照片后,就證明了我的假設(shè)。簡(jiǎn)而言之,它缺乏安全性。拍了照片的主管說(shuō),該地區(qū)的普遍感覺(jué)是“不安全”,“不舒適”,“鼓勵(lì)盡快離開”,“陳舊”。真正有趣的是,該地區(qū)位于東部附近活躍且可到達(dá)的建筑物附近,例如林肯中心,茱莉亞中學(xué)。” Didziapetris說(shuō)。