アプローチ

巨大なデータセットから人気のあるスポット(≒よく撮影される場所)を見つけたい.
これは2次元空間上のクラスタリング問題といえる. Kennedyら(WWW 2008)はこの問題にk-meansクラスタリングを用いた.
この論文ではMean-shiftクラスタリングを用いている. 人気スポットを見つけるには, 分布やクラスタ数が未知なのでノンパラメトリックな手法を用いないといけない. この手法ならデータスケールを決めておくだけで適用できる. データスケールは2つ, 都市:100km ランドマーク:100m, としているらしい.