如何利用大數據準確找出公交車上的小偷?

在舊金山舉行的KDD2016學術會議上,羅格斯大學的熊輝等學者向大家報告了他們的研究論文 Catch Me If You Can:Detecting Pickpocket Suspects from Large-Scale Transit Records 。論文報道在2014年的前9個月就有350個扒手在地鐵交通系統上被抓,490個扒手在公交車上被抓。因此,他們對北京智能公交一卡通數據的分析研究,根據異常交通記錄分析來抓小偷。研究中共使用了北京市2014年4-6月三個月間600萬乘客的約16億智能公交一卡通數據記錄。如下圖所示,熊輝等將北京劃分為多個小的局部的功能區塊,并分析了896條地鐵線經過的44524個公交車站和18條地鐵線經過的320個地鐵站的數據。首先,從每個人的日常出現記錄中提取特征;然后,進行無監督的異常行人檢測和有監督的模式分類,從而挖掘出異常的出行軌跡。

挖掘結果分析

在談到 根據異常交通記錄分析抓小偷 方法的基本原理時,熊輝進一步解釋,通過數據分析,可以看出很多人從熱點區域A,到熱點區域B的交通軌跡,對這些軌跡觀察后,可以看到絕大多數的行人會選擇最優的交通方式,比如,最短時間、距離,或者最少的換乘。但是,一個行人(嫌疑人)選擇的交通路線為A->C->D->B。

熊輝認為, A->C->D->B 這是一種異常的交通方式,對上述異常行為需要進一步地仔細分析,如果該人的異常行為足夠多,那么他很可能是一名扒手。

熊輝公布了他們的研究結果,如下表所示,利用TS-SVM算法,可以達到92.7%的召回率(即能夠正確地識別出92.7%的小偷),但是遺憾的是他們的精確度有點低(也就是說算法的虛警率較高)。

另外,論文還給出了工作日早上8:00-11:00的四種出行模型,如下圖所示。

(a)正常的出行者,可以看出他們主要在居住地、工作地、途經區域活動。

(b)旅游者,可以看出他們頻繁地訪問圓明園、天安門、南鑼鼓巷等景點區域。

(c)購物者,可以看出他們主要訪問王府井、西單等購物區域。

(d)扒手,他們是一種流浪的模式,沒有清晰的目的地,他們頻繁地換乘,隨機的停留,經常進行短途的出行。他們還(一段時間內)頻繁地訪問多種功能區:交通樞紐(例如西直門)、購物區(例如王府井)、景點(例如鼓樓)。對于正常人而言,他們短時間內只訪問一個/一種功能區。

主站蜘蛛池模板: 国精产品自偷自偷综合下载| 亚洲伊人色欲综合网| 久久亚洲精品成人综合| 狠狠色综合久色aⅴ网站| 狠狠色狠狠色综合网| 久久久久久久综合日本亚洲| 亚洲婷婷天堂在线综合| 无码综合天天久久综合网| 伊人久久大香线蕉综合影| 天天影视色香欲综合免费| 成人伊人亚洲人综合网站222| 亚洲婷婷五月综合狠狠爱| 无码综合天天久久综合网| 色婷婷久久综合中文久久蜜桃av | 伊人久久大香线蕉综合影| 亚洲heyzo专区无码综合| 好吊色青青青国产综合在线观看| 久久综合久久久久| 亚洲综合色在线观看亚洲| 久久综合九色综合久99| 色综合天天综合网国产成人网| 久久久综合香蕉尹人综合网| 色噜噜久久综合伊人一本| 涩涩色中文综合亚洲| 亚洲明星合成图综合区在线| 久久综合伊人77777| 久久国产综合精品五月天| 色欲香天天综合网无码| 亚洲人成人伊人成综合网无码| 99久久亚洲综合精品成人网| 精品综合久久久久久97超人| 一本大道无香蕉综合在线| 国产成人+综合亚洲+天堂| 欧美激情综合亚洲一二区| 欧美日韩综合一区二区三区| 色婷婷五月综合欧美图片| 狠狠色丁香婷婷综合潮喷| 天天躁日日躁狠狠躁综合| 国产91久久综合| 中文字幕色综合久久| 天天爽天天狠久久久综合麻豆|