本實驗中的資料由69名Facebook使用者提供,收集區域集中在大台北地區(我的生活圈),收集到 2010/8/25 至 2012/4/30 的打卡資料,下列圖表描述了這個資料集的特點:
表1 收集到的各項資料之數量
項目 | 數量 |
受測者人數 | 69 |
使用者人數 | 25184 |
曾打卡的使用者人數 | 7395 |
地點個數 | 37305 |
打卡數量 | 74283 |
曾對餐廳打卡的使用者人數 | 3928 |
餐廳數量 | 2691 |
對餐廳的打卡數量 | 8264 |
表2 收集到的各項資料之比率
項目 | 比率 | |
受測者男女比(男/女) | 1.16 | 37 / 32 |
使用者男女比(男/女) | 1.13 | 13309 / 11763 |
曾對餐廳打卡的使用者男女比(男/女) | 0.87 | 1825 / 2088 |
曾對餐廳打卡的使用者比率 | 15.60% | 3928 / 25184 |
種類為餐廳的地點比率 | 7.21% | 2691 / 37305 |
對餐廳的打卡比率 | 11.13% | 8264 / 74283 |
公開年齡的使用者比率 | 60.40% | 15212 / 25184 |
公開性別的使用者比率 | 99.56% | 25072 / 25184 |
公開家鄉的使用者比率 | 30.90% | 7782 / 25184 |
公開公司的使用者比率 | 47.10% | 11861 / 25184 |
公開學校的使用者比率 | 80.12% | 20178 / 25184 |
公開家人的使用者比率 | 60.83% | 15319 / 25184 |
公開情人的使用者比率 | 15.90% | 4003 / 25184 |
餐廳打卡在大台北地區的比率 | 67.81% | 5604 / 8264 |
餐廳在大台北地區的比率 | 48.94% | 1317 / 2691 |
曾對大台北地區餐廳打卡的使用者比率 | 69.27% | 2721 / 3928 |
圖1 收集到的所有餐廳之分布圖
表3 收集到的各項資料之平均值、中位數與標準差
項目 | 平均值 | 中位數 | 標準差 | 最大值 | 最小值 | |
受測者朋友數 | 504.01 | 423 | 346.48 | 2200 | 34 | n=69 |
受測者年齡 | 23.28 | 22 | 4.99 | 49 | 18 | n=69 |
使用者年齡 | 23.52 | 22 | 5.87 | 107 | 13 | n=25184 |
曾對餐廳打卡的使用者年齡 | 22.99 | 22 | 4.17 | 106 | 15 | n=3928 |
使用者對餐廳的打卡次數 | 0.34 | 0 | 0.99 | 12 | 0 | n=25184 |
使用者打卡過的餐廳個數 | 0.33 | 0 | 0.93 | 10 | 0 | n=25184 |
餐廳被打卡的次數 | 3.23 | 2 | 6.31 | 224 | 1 | n=2691 |
曾對餐廳打卡的使用者對餐廳的打卡次數 | 2.21 | 2 | 1.48 | 12 | 1 | n=3928 |
曾對餐廳打卡的使用者打卡過的餐廳個數 | 2.10 | 2 | 1.35 | 10 | 1 | n=3928 |
餐廳打卡的餐廳被打卡次數 | 1.05 | 1 | 0.29 | 10 | 1 | n=8264 |
餐廳打卡的打卡者年齡 | 22.96 | 22 | 3.97 | 106 | 15 | n=8264 |
餐廳打卡的同伴平均年齡 | 23.55 | 23 | 3.91 | 107 | 16 | n=8264 |
餐廳打卡的同伴性別指標(女/總數) | 0.56 | 1 | 0.48 | 1 | 0 | n=8264 |
餐廳打卡的同伴人數 | 2.76 | 2 | 2.43 | 42 | 1 | n=8264 |
圖2 統計收集到的餐廳打卡資料
此資料集有許多重要的現象,例如:
- 1位使用者約可帶來365位使用者的資料(收集到的使用者人數/受測者人數),如表1。
- 每7個人就有1個曾對餐廳打卡,每14個地點就有1個是餐廳,每9次打卡就有1次在餐廳,女性較男性熱衷於餐廳打卡上;使用者公開家鄉的比率過低,如表2。
- 大部分的打卡與餐廳集中在大台北地區,如圖1。
- 受測者平均有504個朋友,所有人的平均年齡約24歲;每個人平均對餐廳打卡0.34次,平均打卡過0.33家餐廳,每家餐廳平均被打卡約3次,曾對餐廳打卡的人平均對餐廳打卡約2次,平均打卡過約2家餐廳;餐廳打卡的同伴平均約3人,平均年齡約24歲,女性比率稍高,如表3。
- 大部分的餐廳打卡發生在近半年,周休二日明顯較多,中餐和晚餐時間呈現峰值,打卡者年齡在21歲呈現峰值,同伴年齡在23歲呈現峰值,常結伴同行,同伴性別分布均勻,朋友數量是其他類型的10倍以上;大多數的餐廳只有被打卡1次,相似的使用者只有1個共同打卡過的餐廳居多,如圖2。
若轉換此資料集為使用者與餐廳的二元矩陣,此矩陣有3928行(曾對餐廳打卡的使用者人數)和2691列(餐廳個數),若定義稀疏程度為nonzero/total,此資料集的稀疏程度為0.00078。