- +1
王思聰慶祝iG奪冠,微博抽獎(jiǎng)貓膩何在?

然而事情后來(lái)的走向也令人意想不到。11月11日,王思聰如期公布獲獎(jiǎng)名單之后,卻遭來(lái)廣大網(wǎng)友的質(zhì)疑:總共113個(gè)中獎(jiǎng)人中僅有1名男性,其余全為女性。極不平衡的性別分布,讓大家覺(jué)得微博的抽獎(jiǎng)平臺(tái)的后臺(tái)算法有貓膩。最后引得微博官方出面澄清:

▍事件復(fù)盤(pán):一個(gè)電競(jìng)抽獎(jiǎng)?wù)ǔ隽嗣缞y博主?
王思聰發(fā)出抽獎(jiǎng)微博后,該微博在時(shí)間和空間上的傳播走勢(shì)是如何的?

如此大量的轉(zhuǎn)發(fā),除了王思聰?shù)膫€(gè)人影響力和大獎(jiǎng)的刺激以外,事件發(fā)展也超越了抽獎(jiǎng)本身,引起了極大量的次級(jí)轉(zhuǎn)發(fā)。在網(wǎng)絡(luò)空間上,此次事件的傳播圖以及傳播級(jí)數(shù)分布如下:

但是,從這幾個(gè)次級(jí)傳播中心的轉(zhuǎn)發(fā)微博的內(nèi)容來(lái)看,多數(shù)卻是跟風(fēng)搞自己的抽獎(jiǎng)活動(dòng)的,比如浪里小草莓的這條微博:

▍受眾分析:宅女的進(jìn)擊
那么是哪些人參與了這次事件的轉(zhuǎn)發(fā)呢?男女比例是不是微博官方所稱的1:1.2呢?我們將王思聰原微博的直接轉(zhuǎn)發(fā)和簡(jiǎn)介轉(zhuǎn)發(fā)的用戶都拿出來(lái),對(duì)其畫(huà)像進(jìn)行了研究,并取了5月至10月參與過(guò)iG相關(guān)討論的用戶(視為iG的平時(shí)關(guān)注者)作為對(duì)比。
首先是這兩個(gè)群體在性別和年齡上的差異:


看完這群人的性別和年齡段,我們可以繼續(xù)研究一下這群人的興趣愛(ài)好和生活方式。下面的這張圖的橫軸展示了在轉(zhuǎn)發(fā)王思聰微博的用戶中,有這個(gè)興趣標(biāo)簽的人占到總的有效人數(shù)的比例;縱軸展示了轉(zhuǎn)發(fā)王思聰微博的人在這個(gè)興趣標(biāo)簽上相對(duì)于平時(shí)關(guān)注iG的人的提升度,即這個(gè)興趣標(biāo)簽的人在轉(zhuǎn)發(fā)王思聰微博的用戶中的占比與有這個(gè)興趣標(biāo)簽的人在平時(shí)關(guān)注iG的人中的占比的比值。提升度大于1,表示這些興趣標(biāo)簽是王思聰微博用戶更突出的特征;提升度小于1,表示這些興趣標(biāo)簽是iG平時(shí)關(guān)注者更突出的特征。


那么,本次積極參與到王思聰?shù)某楠?jiǎng)活動(dòng)的這批人呢?經(jīng)過(guò)總結(jié),積極參與到抽獎(jiǎng)活動(dòng)中的人,最起碼有三類人。
第一類是:娛樂(lè)化宅女。她們喜歡宅在家里,睡覺(jué)或者吃東西,吃飽喝足可能上上網(wǎng)看看微博,看看綜藝,追追星,八卦一下最新熱點(diǎn)。試想一下,能在11月6日晚和11月7日早上積極轉(zhuǎn)發(fā)思聰?shù)某楠?jiǎng)微博的,至少也是勤刷微博的了,也很符合這群人的習(xí)慣。思聰?shù)奈⒉┮疬@些人的注意,當(dāng)然是很自然的。



▍水軍識(shí)別:識(shí)別垃圾號(hào)的正確姿勢(shì)
到目前為止,我們已經(jīng)對(duì)思聰抽獎(jiǎng)事件的傳播、觸及到的人群做了一個(gè)詳細(xì)的回顧。我們也確認(rèn)微博的抽獎(jiǎng)結(jié)果是值得質(zhì)疑的。然而微博官方對(duì)于抽獎(jiǎng)結(jié)果男女比嚴(yán)重失衡的解釋,仍然讓人覺(jué)得不太能接受。在@來(lái)去之間 的解釋中,男性更難被抽中的原因是,很多男性只轉(zhuǎn)發(fā)不原創(chuàng),導(dǎo)致很多男性被認(rèn)為是垃圾號(hào)。從這個(gè)解釋中,我們不確定微博用了什么算法,但只從澄清的言辭來(lái)看,可能是使用了諸如轉(zhuǎn)發(fā)微博數(shù)、原創(chuàng)微博數(shù)、原創(chuàng)內(nèi)容中有無(wú)圖片等一些規(guī)則來(lái)做判定。
那么這些規(guī)則是不是有效的?能不能識(shí)別出真正的水軍?
筆者和筆者的同事曾專門(mén)研究過(guò)微博的水軍,在這里可以給讀者們分享一下。
所謂不入虎穴,焉得虎子。我們研究水軍的第一步,是去買粉。我們聯(lián)系了售賣水軍的服務(wù)商,看到了這樣的價(jià)目表:

在筆者為自己的微博賬號(hào)買了1000個(gè)關(guān)注粉絲,1000個(gè)刷轉(zhuǎn)發(fā)和刷評(píng)論的水軍后,我們終于可以觀察一下真實(shí)水軍的特征。經(jīng)過(guò)觀察,我們發(fā)現(xiàn)一些特征,例如:
1. 買來(lái)關(guān)注自己的粉絲,大多數(shù)關(guān)注其他人的數(shù)量比較大,大多數(shù)都在1000以上;買來(lái)刷轉(zhuǎn)發(fā)和刷評(píng)論的水軍,轉(zhuǎn)發(fā)或評(píng)論別人微博的頻次比較高;
2. 會(huì)有原創(chuàng)微博,但是大多數(shù)內(nèi)容是從別的賬號(hào)復(fù)制而來(lái);
3. 其他特征,例如注冊(cè)時(shí)間集中等。
僅從第二條特征來(lái)看,微博官方的以原創(chuàng)微博的數(shù)量少的規(guī)則來(lái)判定垃圾號(hào)的做法就是有失偏頗的,這樣做會(huì)導(dǎo)致一些正常的不喜歡發(fā)原創(chuàng)微博的人被誤判為垃圾號(hào)(精準(zhǔn)率差),同時(shí)沒(méi)有辦法把真正的水軍挑出來(lái),因?yàn)檎嬲乃娨彩菚?huì)發(fā)原創(chuàng)微博的(召回率差)。
我們以買的水軍為正樣本,隨機(jī)抽樣的其他3000個(gè)正常用戶為負(fù)樣本,提取了這些人的社交關(guān)系特征(關(guān)注了多少人,粉絲多少,好友數(shù)等),行為特征(發(fā)的微博數(shù)量,微博被點(diǎn)贊、評(píng)論、轉(zhuǎn)發(fā)的數(shù)量,評(píng)論和轉(zhuǎn)發(fā)其他人微博的次數(shù)等),內(nèi)容特征(微博內(nèi)容)等,構(gòu)建了一個(gè)集成的分類模型。我們?cè)跍y(cè)試集上得到了如下的結(jié)果(黃線為測(cè)試集上的誤差率,橫坐標(biāo)為迭代優(yōu)化的次數(shù),誤差率的含義為:模型預(yù)測(cè)出的標(biāo)簽與實(shí)際的標(biāo)簽不符的比例):

將我們的模型應(yīng)用到本次參與轉(zhuǎn)發(fā)的人中,我們識(shí)別到了8.4萬(wàn)個(gè)水軍,占到總轉(zhuǎn)發(fā)人數(shù)的0.5%左右。這些水軍的男女占比和去水后的男女占比如下:

回顧了這么多,我們不僅對(duì)整個(gè)事件的傳播和觸及到的人群畫(huà)像做了復(fù)盤(pán),看到了這條電競(jìng)?cè)Φ奈⒉┩黄朴螒蚪绫旧?,引發(fā)大量其他領(lǐng)域的KOL轉(zhuǎn)發(fā);而參與抽獎(jiǎng)的主體也并非愛(ài)好游戲動(dòng)漫籃球汽車的平時(shí)關(guān)注iG的直男,竟然被宅在家刷微博睡覺(jué)八卦的宅女群體搶了主角。并且,我們提出了針對(duì)水軍行之有效的辦法,準(zhǔn)確率在99.8%以上。那么,問(wèn)題來(lái)了,@微博官方 考慮不考慮使用我們的水軍識(shí)別服務(wù)呢?
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




