加州理工學(xué)院的研究人員已經(jīng)證明,機(jī)器學(xué)習(xí)算法可以監(jiān)控在線社交媒體對(duì)話。隨著他們的發(fā)展,這可能有一天會(huì)導(dǎo)致一種有效和自動(dòng)化的方式來尋找在線漫游。
該項(xiàng)目匯集了人工智能(A I)研究員Anima Anandkumar、計(jì)算和數(shù)學(xué)科學(xué)教授Bren和政治學(xué)教授MichaelAlvare z。他們的工作于12月14日在2019年加拿大溫哥華舉行的神經(jīng)信息處理系統(tǒng)會(huì)議上展示了人工智能社會(huì)良好研討會(huì)。他們的研究團(tuán)隊(duì)包括博士后學(xué)者劉安琪、加州理工學(xué)院大三學(xué)生瑪雅斯里坎特和尼古拉斯亞當(dāng)斯-科恩(MS' 16,博士)。斯坦福大學(xué)博士。
阿爾瓦雷斯說:“這是我喜歡加州理工學(xué)院的地方之一:它可以跨越界限,發(fā)展社會(huì)科學(xué)和(在這種情況下)計(jì)算機(jī)科學(xué)之間的協(xié)同作用。
防止在線騷擾需要快速檢測(cè)攻擊性、騷擾性和負(fù)面的社交媒體帖子,這反過來又需要監(jiān)控在線互動(dòng)。目前獲取這類社交媒體數(shù)據(jù)的方法要么完全自動(dòng)化,無(wú)法解釋,要么依賴一組靜態(tài)關(guān)鍵詞,很快就會(huì)過時(shí)。斯里坎特說,這兩種方法都不是很有效。
她說:“人類試圖用手完成這項(xiàng)工作是不可延伸的,這些人類可能會(huì)有偏見。另一方面,關(guān)鍵詞搜索也受到網(wǎng)絡(luò)會(huì)話發(fā)展速度的影響。新術(shù)語(yǔ)出現(xiàn),舊術(shù)語(yǔ)改變含義,所以真誠(chéng)使用的關(guān)鍵詞可能意味著第二天的諷刺。
相反,該團(tuán)隊(duì)使用GLoby(全局向量的單詞表示)模型來發(fā)現(xiàn)新的和相關(guān)的關(guān)鍵詞。GloVe是一種單詞嵌入模型,意思是在向量空間中表示單詞,兩個(gè)單詞之間的“距離”是它們的語(yǔ)言或語(yǔ)義相似性的度量。這個(gè)模型可以從一個(gè)關(guān)鍵詞開始,找到與該詞密切相關(guān)的其他關(guān)鍵詞,從而揭示實(shí)際使用的相關(guān)術(shù)語(yǔ)的聚類。例如,在推特上搜索“MeToo”在對(duì)話中的使用會(huì)產(chǎn)生一系列相關(guān)的標(biāo)簽,如“支持幸存者”、“ImWithHer her”和“NotSilent”。該方法為研究人員提供了一個(gè)動(dòng)態(tài)的、不斷發(fā)展的關(guān)鍵詞集進(jìn)行搜索。
但僅僅知道某次談話是否與感興趣的話題有關(guān)是不夠的。語(yǔ)境很重要。為此,GloVe會(huì)顯示一些關(guān)鍵詞的相關(guān)程度,并為其使用提供輸入。例如,在專門討論厭女癥的在線Reddit論壇中,“女性”一詞更有可能與推特上關(guān)于#MeToo運(yùn)動(dòng)的帖子中的“陪伴”、“欲望”和“受害者”等詞聯(lián)系在一起。"
這個(gè)項(xiàng)目是一個(gè)概念的證明,旨在有一天給社交媒體平臺(tái)一個(gè)更強(qiáng)大的工具來發(fā)現(xiàn)在線騷擾。Anandkumar參加了將神經(jīng)信息處理系統(tǒng)會(huì)議的縮寫名稱從最初的首字母縮寫“NIPS”改為“NeuriIPS”的活動(dòng),這讓她對(duì)這個(gè)話題更感興趣。