日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關咨詢
選擇下列產品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關閉右側工具欄

新聞中心

這里有您想知道的互聯網營銷解決方案
使用Python可視化圖表分析行程數據

最近一直在想怎么分析一下個人的行程數據,看看能夠從行程數據里面分析出點什么來。最開始我的期望還是蠻高的,有如下的一些預期:

創(chuàng)新互聯是一家專業(yè)提供晉安企業(yè)網站建設,專注與成都網站設計、網站建設、外貿網站建設、HTML5、小程序制作等業(yè)務。10年已為晉安眾多企業(yè)、政府機構等服務。創(chuàng)新互聯專業(yè)網站建設公司優(yōu)惠進行中。

  • 根據出行時間范圍,可以基本確定他的生活節(jié)奏,工作強度
  • 能夠通過行程時間范圍來猜測汽車尾號
  • 根據出行的耗時歷史來建議出行時間

如果能夠分析得到這些信息,感覺還是蠻有意思的,于是開始自己動手,第一個問題就是數據源,導航軟件目前還不提供行程數據的導出,所以我是把7-8兩個月的行程數據逐個照著導航行程整理出來了,大體的數據情況還可以,不過其中有些數據做了額外處理,比如時間的處理,因為是如果是7:15,那么按照數字化顯示就不能是7.15,而更合理的顯示是7.4,還有行程時間,比如1:30,是需要統(tǒng)一按照分鐘90分鐘來整合的,整理后得到的數據如下:

首先我按照時間做了對行程的耗時做了分析,結果發(fā)現這個數據似乎不大理想,本來預期是比較穩(wěn)定的,還打算按照這個數據做下預測。

這種情況下就得換一個思路了,先看看數據的整體分布,使用條形圖其實是不好體現數據的分布情況,因為有些行程之間是沒有直接關聯的,比如早上和晚上的行程,因為時間的差異,條形圖的模式反而會有很大的抖動。

如下是按照行程的耗時分布圖:

如下是行程出發(fā)時間的分布情況,基本上來說都是在6:30~7:00之間開始出發(fā),晚上基本在20:00左右返程。

如下是按照周一到周日的行程耗時分布,可以明顯看到周二的行程分布要少很多,還不如周六,周日的多,所以從這一點是可以猜出來很可能是因為限號。

當然前面提到了兩個指標,一個是行程耗時,一個是出發(fā)時間,還有一個是路程,因為路程和耗時兩者是有一定關聯,但是折算下來一個折中的指標就是平均速度。所以按照平均速度的分布情況來看,周一和周五是最堵的,相對周四和周六是最通暢的。

我們區(qū)別于一般的可視化,引入箱線圖,可以看到平均行程的耗時在45分鐘左右,區(qū)間基本在30-60分鐘之間。

其實數據分析到了這里,還是有很大差異的,雖然或多或少的分析出來了一些內容,但是有些指標還是沒有充分使用到,而且顯示的指標情況還是不夠清晰,所以打算使用seaborn進一步做下調整。

如下是行程距離,行程耗時和星期數的綜合分布圖。

如下是星期和行程耗時的分布圖,相比之前的分布圖來說會更加清晰一些。

我們繼續(xù)引入平均速度,出發(fā)時間和星期數進行關聯,可以看到整個行程會有明顯的分水嶺,早間和晚間基本堵是工作日,而其他的時間基本都是周末。

而要進一步探索這些數據指標間的關聯,就需要引入略復雜的圖PairGrid,可以把多個指標都放入,可以生成多個維度的分布圖。

 

接下來需要對數據的指標情況進一步分析,引入檢驗和預測的功能。

本文轉載自微信公眾號「楊建榮的學習筆記」,可以通過以下二維碼關注。轉載本文請聯系楊建榮的學習筆記公眾號。


分享標題:使用Python可視化圖表分析行程數據
文章鏈接:http://m.5511xx.com/article/copdgsj.html