Facebook餐廳打卡資料分析

本實驗中的資料由69名Facebook使用者提供,收集區域集中在大台北地區(我的生活圈),收集到 2010/8/25 至 2012/4/30 的打卡資料,下列圖表描述了這個資料集的特點:

表1 收集到的各項資料之數量

項目數量
受測者人數69
使用者人數25184
曾打卡的使用者人數7395
地點個數37305
打卡數量74283
曾對餐廳打卡的使用者人數3928
餐廳數量2691
對餐廳的打卡數量8264

表2 收集到的各項資料之比率

項目比率
受測者男女比(男/女)1.1637 / 32
使用者男女比(男/女)1.1313309 / 11763
曾對餐廳打卡的使用者男女比(男/女)0.871825 / 2088
曾對餐廳打卡的使用者比率15.60%3928 / 25184
種類為餐廳的地點比率7.21%2691 / 37305
對餐廳的打卡比率11.13%8264 / 74283
公開年齡的使用者比率60.40%15212 / 25184
公開性別的使用者比率99.56%25072 / 25184
公開家鄉的使用者比率30.90%7782 / 25184
公開公司的使用者比率47.10%11861 / 25184
公開學校的使用者比率80.12%20178 / 25184
公開家人的使用者比率60.83%15319 / 25184
公開情人的使用者比率15.90%4003 / 25184
餐廳打卡在大台北地區的比率67.81%5604 / 8264
餐廳在大台北地區的比率48.94%1317 / 2691
曾對大台北地區餐廳打卡的使用者比率69.27%2721 / 3928

圖1 收集到的所有餐廳之分布圖

表3 收集到的各項資料之平均值、中位數與標準差

項目平均值中位數標準差最大值最小值
受測者朋友數504.01423346.48220034n=69
受測者年齡23.28224.994918n=69
使用者年齡23.52225.8710713n=25184
曾對餐廳打卡的使用者年齡22.99224.1710615n=3928
使用者對餐廳的打卡次數0.3400.99120n=25184
使用者打卡過的餐廳個數0.3300.93100n=25184
餐廳被打卡的次數3.2326.312241n=2691
曾對餐廳打卡的使用者對餐廳的打卡次數2.2121.48121n=3928
曾對餐廳打卡的使用者打卡過的餐廳個數2.1021.35101n=3928
餐廳打卡的餐廳被打卡次數1.0510.29101n=8264
餐廳打卡的打卡者年齡22.96223.9710615n=8264
餐廳打卡的同伴平均年齡23.55233.9110716n=8264
餐廳打卡的同伴性別指標(女/總數)0.5610.4810n=8264
餐廳打卡的同伴人數2.7622.43421n=8264

圖2 統計收集到的餐廳打卡資料

此資料集有許多重要的現象,例如:

  • 1位使用者約可帶來365位使用者的資料(收集到的使用者人數/受測者人數),如表1。
  • 每7個人就有1個曾對餐廳打卡,每14個地點就有1個是餐廳,每9次打卡就有1次在餐廳,女性較男性熱衷於餐廳打卡上;使用者公開家鄉的比率過低,如表2。
  • 大部分的打卡與餐廳集中在大台北地區,如圖1。
  • 受測者平均有504個朋友,所有人的平均年齡約24歲;每個人平均對餐廳打卡0.34次,平均打卡過0.33家餐廳,每家餐廳平均被打卡約3次,曾對餐廳打卡的人平均對餐廳打卡約2次,平均打卡過約2家餐廳;餐廳打卡的同伴平均約3人,平均年齡約24歲,女性比率稍高,如表3。
  • 大部分的餐廳打卡發生在近半年,周休二日明顯較多,中餐和晚餐時間呈現峰值,打卡者年齡在21歲呈現峰值,同伴年齡在23歲呈現峰值,常結伴同行,同伴性別分布均勻,朋友數量是其他類型的10倍以上;大多數的餐廳只有被打卡1次,相似的使用者只有1個共同打卡過的餐廳居多,如圖2。

若轉換此資料集為使用者與餐廳的二元矩陣,此矩陣有3928行(曾對餐廳打卡的使用者人數)和2691列(餐廳個數),若定義稀疏程度為nonzero/total,此資料集的稀疏程度為0.00078。