趙熙寧

在〈自動篩選惡意言論,找出省錢關鍵! 深度學習結論篇:找出開源節流關鍵〉一文中,我們講解了如何利用深度學習中的 GRU 模型,在問答平台上精準地去除惡意留言,並利用各個模型的財務指標,來判斷哪個模型是較合適的終極選擇。在本篇中,我們將從過往去除惡意留言的技術出發,探討不同的商業模式以及其不同的應用。 技術的延伸應用 除了在網路論壇清理惡意言論,讓使用者觀看到更有建設性的言論之外,這項去除惡意言論的技術其實還有潛力應用在影音平台和線上百科全書。 YouTube影音平台 抓取正確的目標客群是 YouTuber 以及 YouTube 廣告商最為關注的事情,對於 YouTuber,正確的目標客群代表相同的訂閱數之下,更高的影片觀看次數,以及更多的營收;對於 YouTube 廣告商而言,正確的目標客群代表相同的成本之下,更長的觀看時間、更高的轉換率與營收。 留言在其中扮演舉足輕重的角色。在很大程度上,留言反映出留言者是否為預設的目標客群。首先,對於惡意攻擊的「黑粉」,我們不需要花費多餘的時間或人力成本進行回覆;其次,對於具有建設性的反對留言,在深入了解之後,便可作為精進產品的標的;至於將惡意與反對留言篩選出來之後,其餘的留言者,便會是精準的目標客群,除了將更多回覆留言的成本分配在這群人身上,YouTuber 也可根據這些粉絲的建議,隨時調整影片的方向,藉以吸引更多人成為 YouTube 上的會員。

自動篩選惡意言論,找出省錢關鍵!深度學習應用篇: 影音平台及線上百科全書之應用
自動篩選惡意言論,找出省錢關鍵!深度學習應用篇: 影音平台及線上百科全書之應用

在〈自動篩選惡意言論,找出省錢關鍵! 深度學習結論篇:找出開源節流關鍵〉一文中,我們講解了如何利用深度學習中的 GRU 模型,在問答平台上精準地去除惡意留言,並利用各個模型的財務指標,來判斷哪個模型是較合適的終極選擇。在本篇中,我們將從過往去除惡意留言的技術出發,探討不同的商業模式以及其不同的應用。

技術的延伸應用

除了在網路論壇清理惡意言論,讓使用者觀看到更有建設性的言論之外,這項去除惡意言論的技術其實還有潛力應用在影音平台和線上百科全書。

YouTube影音平台

抓取正確的目標客群是 YouTuber 以及 YouTube 廣告商最為關注的事情,對於 YouTuber,正確的目標客群代表相同的訂閱數之下,更高的影片觀看次數,以及更多的營收;對於 YouTube 廣告商而言,正確的目標客群代表相同的成本之下,更長的觀看時間、更高的轉換率與營收。

圖1. 一位 YouTuber 正在檢查自己的頻道成效(credit: USA-Reiseblogger)

留言在其中扮演舉足輕重的角色。在很大程度上,留言反映出留言者是否為預設的目標客群。首先,對於惡意攻擊的「黑粉」,我們不需要花費多餘的時間或人力成本進行回覆;其次,對於具有建設性的反對留言,在深入了解之後,便可作為精進產品的標的;至於將惡意與反對留言篩選出來之後,其餘的留言者,便會是精準的目標客群,除了將更多回覆留言的成本分配在這群人身上,YouTuber 也可根據這些粉絲的建議,隨時調整影片的方向,藉以吸引更多人成為 YouTube 上的會員。

Wikipedia 線上百科全書

審核維基百科的惡意留言也是一項重要的應用。維基百科是人人都可以造訪、編輯的網站,這使得維護變得十分不便,為了解決虛假資訊的問題,維基媒體基金會的首席資料科學家亞倫.哈爾法克(Aaron Halfaker)早在 2015 年便開發出了一個人工引擎,用以辨別蓄意破壞的修訂行為,然而,對於精心編造的虛假條目,這套系統卻是一籌莫展。

--

--

情境

假設你代表公司,到了一個陌生的城鎮和客戶開會,下了捷運才發現目的地還有十分鐘的路程,正午日光曝曬,走路實在很累,但搭計程車過去好像又有些浪費,你陷入了兩難......。

這時,若能有一台隨借隨還的腳踏車,是不是能帶來莫大的幫助?

Photo by: Murillo de Paula

為了研究人群在城市之中的流動性,華盛頓哥倫比亞特區(Washington, D.C.)的研究人員藉由大量的單車租借紀錄,進一步預測未來每個時段的需求量。

解決方法

資料簡介

資料由華盛頓特區的一家自行車共享系統 Capital Bikeshare 所提供,總共包含兩年、共 17379 筆資料,其中資料的切分方法則是以日期切分,每個月 19 號以前為訓練資料,總共 10886 筆,20 號以後為測試資料,總共 6493 筆,而最終目的就是根據所提供的欄位,包括氣溫、雨量、季節、節日與否等等,預測出每小時腳踏車的總租借數。

--

--

趙熙寧

趙熙寧

非典型社科院學生,關注資料科學、心理學、行銷話題。