愚人節玩笑被用來識別假新聞,研究說兩者在敘事上存在相似性

作為一種欺騙性質的敘事,愚人節玩笑與假新聞方面存在相似性。

英國蘭卡斯特大學(Lancaster University)的在讀博士生 Edward Dearden 與講師 Alistair Baron 博士整理了 14 年的愚人節玩笑文本,並將其與其他研究員彙編的假新聞數據庫進行比對,給出了上述結論

兩位研究員聲稱,他們收集了 14 年間 370 多個網站發佈的 500 多個愚人節玩笑。在與假新聞數據庫進行比對後,他們發現,假新聞與愚人節玩笑在文本結構上存在相似性。

例如,相對真實報道,假新聞、愚人節玩笑更容易閱讀、通常少用具體的細節,包括人名、地址、時間,但使用的句子通常更長。

這篇論文 Fool’s Errand: Looking at April Fools Hoaxes as Disinformation through the Lens of Deception and Humour 將在 4 月 7-13 日的 CICLing 2019 大會上公佈。

根據他們現在公佈的結論,與真實報道相比,假新聞通常具有如下特徵:

  • 篇幅較短
  • 容易閱讀
  • 使用簡單的語句
  • 包含較少的標點符號
  • 包含更多專有名詞
  • 通常情況下使用非正式的表述——使用更多的名(而非姓),比如“希拉里”,包含更多的髒話和拼寫錯誤
  • 較少包含日期
  • 多采用第一人稱代詞

與真實報道相比,愚人節玩笑通常具有如下特徵:

  • 篇幅通常較短
  • 使用更多獨特詞彙
  • 句子更長
  • 更容易閱讀
  • 提及更多未來不明確的事件
  • 包含更多當下的參考信息
  • 對過去的事情不太感興趣
  • 較少使用專有名詞
  • 多采用第一人稱代詞

由於論文尚未公佈,研究員的論文信息較為缺乏,包括愚人節玩笑來源、比對的假新聞數據庫覆蓋哪些方面等。

在課題上,對比假新聞與愚人節玩笑是 Edward Dearden 最近聚集的課題。他在英國蘭卡斯特大學攻讀計算機科學中的自然語言處理,集中在網絡造謠主題上。

Edward Dearden 稱:"愚人節惡作劇是非常有用的,因為它們為我們提供了一個可驗證的欺騙性文本,讓我們有機會了解到(假新聞)作者用虛構信息偽裝真實的報道時所用的語言技巧。"

兩位研究員還據此設計了一個分類算法,用於區分愚人節玩笑、假新聞。他們聲稱,分類算法在識別愚人節玩笑上的準確率在 75%,假新聞的識別率在 72%。當他們利用愚人節玩笑培訓這個分類算法時,在識別假新聞上的準確率在 65%。

這種將假新聞與愚人節玩笑進行比對研究的方式並不新鮮。此前,媒體網站將愚人節玩笑直接稱作假新聞(fake news)。但在 2017 年前後,假新聞與愚人節玩笑在定義上就不再那麼接近,假新聞變成了整個社會關注的大話題。Facebook、Google 等傳播信息與內容的平臺也因此頻繁受到指責。

過去也確實有人將真實事件與愚人節玩笑混淆。Google 推出 Gmail 郵箱是比較突出的案例之一。Google 在 2004 年愚人節推出 1G 存儲空間、免費的 Gmail 郵箱服務時,很多人都將其視為愚人節玩笑

這種當時聽上去巨大容量的郵箱服務令人懷疑也是有理由的。洋蔥新聞 The Onion 的編輯 Baratunde Thurston 稱,一種區分的方式是,“任何好得令人難以置信的事情都需要懷疑”。該網站專注提供假新聞作諷刺目的。

相對過去常用的事實核查方式而言,從文本結構上比對假新聞與愚人節玩笑的視角也許較新。對於用戶而言,這也意味著在區分假新聞上增加了一個視角。

但製作假新聞分類器這類技術手段控制假新聞已經是近年比較流行的方式。

傳統的事實核查方式仍在延續,核查新聞來源、多渠道交叉驗證,確認調查報告的樣本量等。例如,專注於政治內容的非盈利組織 FactCheck.org 在進行事實核查時,主要資料是美國主流電視臺的視頻、白宮官網的文本等。該機構 2016 年宣佈與 Facebook 合作。

但現在,科技公司審核信息真實性的措施實際的正面影響有限。科技公司合作的 FactCheck.org 等事實核查機構在事實真實性的看法上存在差異,設置的舉報假新聞機制存在問題。

根據斯坦福大學的一份研究,《華盛頓郵報》旗下的 Fact-Checker 與 PolitiFact 共同核查的 70 份信息上,兩個機構只在 56 份上達成了信息真實性的一致意見。

科技公司希望依賴於用戶自己舉報假新聞的努力也效果不佳。根據耶魯大學的一份研究,Facebook 用戶對於沒有標註“有爭議”標籤的信息上傾向於認為該信息有更高的真實性,但實際只有極少數這類信息存在真實性。


題圖來自:rawpixel.com from Pexels