顯示廣告
隱藏 ✕
※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2018-10-20 10:22:49
看板 Gossiping
作者 hancel (hancel)
標題 [爆卦] i'Analyseur 的重大問題
時間 Sat Oct 20 06:41:37 2018


現在有很多鄉民/黨工喜歡用i'Analyseur,
來分析/抓出 五毛/黨工....
i'Analyzeur的設計策略基本上是對的,
就是利用ip/登入時間/文章列表來抓出不尋常/異常的行為.

但是裡面的ip紀錄的擷取方法,很明顯是有bug的,
或者是說,有不盡完善的地方.
因為這個bug,大家所看到的ip交叉分析是有對有錯.
可是有對有錯,代表如果大家直接用這個結果來分析,
很容易推導出錯誤的結論.


首先,先拿八卦版版主的ip紀錄來看好了
https://www.ianalyseur.org/user/RandyMarsh/
i'Analyseur - User: randymarsh
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...

 
https://www.ianalyseur.org/user/IbakaBlock/
i'Analyseur - User: ibakablock
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...

 
https://www.ianalyseur.org/user/jacklyl/
i'Analyseur - User: jacklyl
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...

 
https://www.ianalyseur.org/user/girl55665566/
i'Analyseur - User: girl55665566
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...

 
https://www.ianalyseur.org/user/PPTplayer/
i'Analyseur - User: pptplayer
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...

 
https://www.ianalyseur.org/user/RS5566/
i'Analyseur - User: rs5566
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...

 

靠,這幾個人是分身大王啊?
IP遍佈各地,甚至到國外去了.
如果你有這個結論,那你就已經被i'Analyseur的bug給愚弄了.

i'Analyseur的ip紀錄,應該有根據發表文章上的ip/時間,
做為上線ip以及時間的紀錄之一.
但是這個parsing(懶得解釋了)一定是有bug的.
會把一篇文當中引用其他人的文的ip/時間也算進發表人.

"請問要引用原文嗎(Y/N/All/Repost)?[Y] r"
裡面一般的Y引用可能是沒問題的(因為只留文章,且加":"),
但是Repost引用(沒有前置":")會導致,
被引用跟引用者兩人身分的混淆.

這就導致喜歡引用它人發文/發文常常被引用的人,
有機會會混在一起分不出來.
本篇文章中的諸位分身大王,
就是因為常常要開水桶藥單,
必須引用許多文章最為裁決證明,
導致錯誤結果.


結論:
在i'Analyseur的ip紀錄的parsing bug解決,
並將整個資料庫重新更新之前,
最好不要"直接"用它做重大指控,
參考可以,但是下結論之前,
自己最好多動手觀察/紀錄,
確認之後在說吧.

畢竟搞出烏龍被告被酸的時候,
i'Analyseur它也不會幫你扛的.

另外,bug未修之前,有心人想要故意搞亂這個資料庫也是沒問題的.
例如,把我下面那三行前面":"去除,
放到你的文章當中,
你可能就會多了三個有來頭登錄ip了.
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.130.192.150
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.8.116
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.92.207.178
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.6.102.107
※ 文章代碼(AID): #1RobscDT (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1539988902.A.35D.html
firemothra: 沙發1F 36.239.18.149 台灣 10/20 06:42
koreawargod: 沒差啦..說你網軍就網軍啊...都說了2F 223.140.48.208 台灣 10/20 06:42
koreawargod: 查我自己id..還出來一堆不認識的笑死
firemothra: 浮動ip阿4F 36.239.18.149 台灣 10/20 06:43
rrr518: 數據給你你要自己判讀啊 2樓就是看不懂的5F 101.13.6.241 台灣 10/20 06:44
rrr518: 人XD
meredith001: 創世神認證的阿 黨工很怕吼7F 1.163.119.45 台灣 10/20 06:45
s033507799: 不認識很正常好嗎,你會知道誰跟你用8F 180.204.10.57 台灣 10/20 06:46
s033507799: 同ip喔
JCS15: 放心 寫這系統的防火牆都堵好了 人家拿來亂10F 36.228.142.210 台灣 10/20 06:46
JCS15: 搞與他無關
OK8066889: 很怕喔 禮拜六早上特地發一篇12F 36.236.105.97 台灣 10/20 06:47
Pujols5: 沒差吧 我看不管是說廠工還是說柯粉13F 72.201.192.249 美國 10/20 06:47
Pujols5: 都沒有人在附證明的啊
newwu: 還好啦  也只有板主有這狀況15F 128.146.189.92 美國 10/20 06:48
喜歡無":"引用別人發文,
跟常常被人無":"引用發文的人,
通通都會中鏢的.
這還不包括故意要搞破壞的人.

howard0730: 查出用過相同IP->點IP->看時間分析16F 114.37.162.204 台灣 10/20 06:49
總之,就是很有參考價值,
不過最好還是得親自好好檢查,
多觀察一下再下結論.

howard0730: 時間差很遠當然不懷疑, 時間很相近17F 114.37.162.204 台灣 10/20 06:50
howard0730: 小於1天, 那就很有可能是分身囉
rrr518: 所以說你不會看數據啊19F 101.13.6.241 台灣 10/20 06:51
newwu: 誰會有那種奇怪的習慣啦...20F 128.146.189.92 美國 10/20 06:52
koster: 你拿到統計數據就直接用嗎? 不修正連丁丁21F 64.85.235.108 美國 10/20 06:59
koster: 的民調都會破五成
chocoislove: 看不懂先推23F 114.43.6.138 台灣 10/20 07:01
ppnow: 那你做一個更好的啊,做不出來就閉嘴24F 36.237.141.216 台灣 10/20 07:02
你玻璃心啊? 我不是說很有參考價值,
但是要做重大決定之前,
請自己小心一點,多做複查動作.
其實這個Bug不好解決的,如果你有一點CS背景的話就知道.

cerberi: 原來如此25F 42.71.141.211 台灣 10/20 07:08
zanns: 慘惹 現在領500還要學數據分析 我姆咪QQ26F 122.254.41.209 台灣 10/20 07:13
拜託,整個團隊中有一個人可以就好了,
其他人找出問題,然後由那一個比較懂得的人,
去做最後的查驗就好啊....

fakon: CS 不好解決,那你一定是選錯地圖了!27F 123.194.133.150 台灣 10/20 07:20
Richun: 這個bug要修的話 文章網址前一行跟之後的28F 123.193.39.67 台灣 10/20 07:20
GGononder: 三小心態啊 臭嘴29F 223.137.139.17 台灣 10/20 07:20
Richun: 才算是作者IP應該能解決吧30F 123.193.39.67 台灣 10/20 07:20
這防不了有心搞破壞的人...
因為這是文字檔,發表以後可以任意修改的.
更不用說,發表前的內容就可以製造兩難了.

Richun: 只是對會刪網址又會亂引的又是個新的問題31F 123.193.39.67 台灣 10/20 07:22
JCS15: 從文章底部往回抓 不過遇到修文補充的也會32F 36.228.142.210 台灣 10/20 07:25
JCS15: 破功
就說這其實是一個很難修的問題啊..╮(﹋﹏﹌)╭..

donkilu: IP parsing有心要去弄的話真的無解34F 172.58.109.54 美國 10/20 07:31
donkilu: 但我覺得這種人應該不多就是了
牽扯到重大利害關係的時候,
就很有可能會出現有心人.
殺人都有可能了,更何況只是簡單的蓄意誤導?
因為要騙的對象是程式,不是人.

Richun: 一般的parsing加上把不合常規的修文抓出來36F 123.193.39.67 台灣 10/20 07:34
Richun: 多少能避免有人去規避掉IP吧
Richun: 只是這樣還是不能解決直接修發表IP的問題
※ 編輯: hancel (24.6.102.107), 10/20/2018 07:48:44
chx64: 我光是非常確定是XDDDDDDDDDD的分身ID為39F 112.104.113.45 台灣 10/20 07:59
chx64: j0958322080都抓不出來了  就知道超沒用
chx64: 而且資料庫好一陣子沒更新了的樣子
autoupdate: 如果是這樣,真的是嚴重bug42F 36.239.87.121 台灣 10/20 08:08
hcwang1126: bug修就好了 沒什麽43F 1.164.146.106 台灣 10/20 08:27
gay7788: 反正說人黨工又不用證據,沒差44F 61.219.191.4 台灣 10/20 08:29
kinki999: 反正那作者也是做出來,貼圖講別人黨工45F 220.134.101.115 台灣 10/20 08:36
greedystar1: 昨天才有人爆料候選人的多重影分身46F 42.77.207.111 台灣 10/20 08:42
greedystar1: 今天就一篇這個網站有重大瑕疵
chrome: 推48F 223.139.49.213 台灣 10/20 08:52
z4525881: 可是這個瑕疵真的超大啊,如果黨工蓄意49F 111.82.95.18 台灣 10/20 08:54
z4525881: 要回避的話還真的無法可管
London2006: 這個網站只是參考用的工具,最主要還51F 61.223.2.223 台灣 10/20 09:18
London2006: 是要學會自我判斷
wawawakou: 原來如此。53F 223.137.224.203 台灣 10/20 09:44
WindSucker: 你網軍54F 111.82.162.88 台灣 10/20 09:48
Skydier: 還一堆腦殘文組狂甲拿這個沾沾自喜55F 223.140.76.130 台灣 10/20 09:48
Skydier: 真是不忍唏噓
sharb: 誰屌你啊 網軍啾4網軍57F 1.171.154.242 台灣 10/20 10:08
asd456fgh778: 你可以寄信給他顆顆58F 114.136.158.165 台灣 10/20 10:12
terry910333: 高調推59F 122.117.178.120 台灣 10/20 10:13

--
※ 看板: Gossiping 文章推薦值: 0 目前人氣: 0 累積人氣: 714 
作者 hancel 的最新發文:
點此顯示更多發文記錄
分享網址: 複製 已複製
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇