RでFukuoka City Wi-Fiの利用状況を可視化する
オープンデータとして、Fukuoka City Wi-Fiの利用状況のCSVファイルが公開されています↓
Fukuoka City Wi-Fi 利用状況 - データセット - 福岡市のCKAN
が、例によってなかなか扱いにくそうなフォーマットになっております↓
1拠点の1日が1行になっており、その行の中に0時台、1時台、2時台、~、23時台のように横に伸びてデータが格納されています。別の日は、別の行に格納されています。
そのままじゃ扱いにくそうなので、日付時刻型で表現して、形もシンプルにしましょう。
そうすると、冗長だけどシンプルな形式になりました↓
ひと月の合計値で棒グラフを書いてみましょう。認証回数の少ない順にソートしています。なんとなくggplotを使ってみました。(いまいち、まだ慣れていない感が・・・)
ggplotのリファレンスはウェブにも秀逸なものがあるので、細かいところはそちらでチェックしてください。
Fukuoka City Wi-Fi 認証回数の合計値(2014年10月)(PDFファイル)
↓PDFファイルのスクリーンショット
やっぱり、博多駅、天神駅が利用者が多いですね。アゴーラ福岡のゼロ(しかも3ヶ月連続)ってのは何だろう。稼動していなかったのか、本当に誰も使わなかっただけなのか。
せっかく日付時刻型にしたので、時系列の推移も見てみましょう。
ggplotだと、拠点ごとにわけて複数のグラフにするってのが簡単にできますね。
1時間ごとの認証回数.pdf(PDFファイル)
↓PDFファイルのスクリーンショット
なんか心電図みたいですね。これが心電図なら、アゴーラ福岡は、ご臨終ですね。
基本1日ごとに山になっているんですが、朝と晩にピークがあって昼間に下がる感じで2つの山っぽく(M字みたいに)なっているものも多いです。そして、博多駅などは土日祝日は山が小さくなってますね。図書館は、平坦になっていることで休館日が分かります。
公開されているのは拠点ごと(=複数のアクセスポイント)のデータですが、APごとにデータを見られれば、APが足りているのか不足気味なのかとか分かりそうです。
アゴーラは撤退してもいいんじゃないでしょうか。そして、うちの集合住宅の目の前にでも付けてもらえると助かります。
っていうか、
なんて、書いてあるくせに、去年(2014年)の10月のデータを最後にデータが更新されていません。
となっているので、これはメンテナーがさぼっているってことでしょうか。そういうことは、やめんてな。
「エントリを駄洒落で締める四十代」
Fukuoka City Wi-Fi 利用状況 - データセット - 福岡市のCKAN
が、例によってなかなか扱いにくそうなフォーマットになっております↓
福岡市のオープンデータサイトで公開されていたCSVの形式 |
1拠点の1日が1行になっており、その行の中に0時台、1時台、2時台、~、23時台のように横に伸びてデータが格納されています。別の日は、別の行に格納されています。
そのままじゃ扱いにくそうなので、日付時刻型で表現して、形もシンプルにしましょう。
d <- read.csv("201410access.csv") d <- d[d$X != "合計", ] # 合計が入っているレコードは削除する df <- data.frame() # 空のデータフレームを用意しておく for ( i in 1:nrow(d) ) { tmp <- paste(d[i, ]$X, sprintf("%02d", 0:23)) YmdH <- strptime( tmp, "%Y%m%d %H") value <- as.vector(t(d[i, 4:27])) df <- rbind(df, data.frame( 年月日時 = YmdH, 拠点名 = d[i, ]$拠点名, 認証回数 = value ) ) }
そうすると、冗長だけどシンプルな形式になりました↓
CSVの形式を変えてみたもの |
ひと月の合計値で棒グラフを書いてみましょう。認証回数の少ない順にソートしています。なんとなくggplotを使ってみました。(いまいち、まだ慣れていない感が・・・)
ggplotのリファレンスはウェブにも秀逸なものがあるので、細かいところはそちらでチェックしてください。
library(ggplot2) s <- sort(tapply(df$認証回数, df$拠点名, sum)) df_sum <- data.frame(拠点名=names(s), 認証回数=s) pdf("認証回数合計グラフ.pdf", family="Japan1GothicBBB", width=11.69, height=8.27) g <- ggplot(df_sum, aes(x=reorder(拠点名, 認証回数), y=認証回数)) g <- g + geom_bar(width=0.8, stat="identity") g <- g + geom_text(aes(label=認証回数), angle=90, hjust=-0.1, vjust=0.4, size=3) g <- g + theme(axis.text.x = element_text(angle=90, hjust=1, vjust=0.4, size=8)) g <- g + ggtitle("Fukuoka City Wi-Fi 認証回数の合計値(2014年10月)") + xlab("") + ylab("認証回数の合計") g <- g + ylim(0,115000) # 数字が切れないギリギリ plot(g) dev.off()
Fukuoka City Wi-Fi 認証回数の合計値(2014年10月)(PDFファイル)
↓PDFファイルのスクリーンショット
Fukuoka City Wi-Fi ひと月のアクセス数の合計値 |
やっぱり、博多駅、天神駅が利用者が多いですね。アゴーラ福岡のゼロ(しかも3ヶ月連続)ってのは何だろう。稼動していなかったのか、本当に誰も使わなかっただけなのか。
せっかく日付時刻型にしたので、時系列の推移も見てみましょう。
ggplotだと、拠点ごとにわけて複数のグラフにするってのが簡単にできますね。
1時間ごとの認証回数.pdf(PDFファイル)
↓PDFファイルのスクリーンショット
Fukuoka City Wi-Fi 1時間ごとの利用者数の推移 |
なんか心電図みたいですね。これが心電図なら、アゴーラ福岡は、ご臨終ですね。
基本1日ごとに山になっているんですが、朝と晩にピークがあって昼間に下がる感じで2つの山っぽく(M字みたいに)なっているものも多いです。そして、博多駅などは土日祝日は山が小さくなってますね。図書館は、平坦になっていることで休館日が分かります。
公開されているのは拠点ごと(=複数のアクセスポイント)のデータですが、APごとにデータを見られれば、APが足りているのか不足気味なのかとか分かりそうです。
アゴーラは撤退してもいいんじゃないでしょうか。そして、うちの集合住宅の目の前にでも付けてもらえると助かります。
っていうか、
Fukuoka City Wi-Fi各拠点の1時間ごとの利用状況(認証回数)のデータです。月1回中旬頃に前月分データを提供。
なんて、書いてあるくせに、去年(2014年)の10月のデータを最後にデータが更新されていません。
作成者 : 福岡市市長室
メンテナー: 広報課
となっているので、これはメンテナーがさぼっているってことでしょうか。そういうことは、やめんてな。
「エントリを駄洒落で締める四十代」
コメント
コメントを投稿