『リクナビNEXT Tech総研』の研究レポート、ミクシィの“ソーシャルグラフ”データ解析技術とは
株式会社リクルート(本社:東京都千代田区 代表取締役社長 兼 CEO:柏木 斉)が運営するサイト『リクナビNEXT Tech総研』( http://rikunabi-next.yahoo.co.jp/tech/ )は、エンジニアの「仕事・職場の実態・気になる給与」「賢い転職ノウハウ」情報を毎日お届けしています。
―――――――――――――――――――――――――――――――――――――
■ソーシャルグラフを分析しその知見を社会に還元する
ミクシィの“ソーシャルグラフ”データ解析技術とは
―――――――――――――――――――――――――――――――――――――
ソーシャル・ネットワーキング・サービス(SNS)では、ソーシャルグラフと呼ばれるデータが活用されています。「mixi」では、日々どのような方法でこのソーシャルグラフを分析しているのか。『Tech総研』編集部は、その最前線で活躍するmixiシステム本部 木村俊也氏に直撃インタビューしました。
「『mixi』は、人々の心地よいつながりを提供することを、事業のミッションとしています。しかし、この心地よさというのは、一体何なのか。定性的には言えても、これを定量的に捉えるのは非常に難しいものです。『mixi』の中を流れるトラフィックや、そこで交わされるコミュニケーションの成り立ち、コミュニティが生まれる構造などを解き明かすことで、“心地よさ”を定量的、数値的に証明することができるのではないか。ソーシャルグラフを分析し、その知見を社会に還元するのが、私たちソーシャルグラフ・プロバイダーの責務だと思うのです」と、木村氏はソーシャルグラフ分析の意義について語ります。
これまでの「mixi」におけるソーシャルグラフ分析は、メンバーごとのプロフィールやリンクをリレーショナル・データベースに蓄え、これをダンプし、非正規化した上でKVS(Key-Value Store)に落とし、それを高速に回してデータを生成するというのが一般的でした。
しかし、ホップ数を増やしてリンク先の細かい属性を分析しようとすると、いろいろなグラフを解析しなければならず、DBの数も無制限に増え、解析スピード、スケラビリティの点でも問題が生じるようになります。そこで近年の「mixi」で採用されているのが、グラフ専用データベースのGraphDBです。
8月に都内で開かれたリクルート主催の「Japan Innovation Leaders Summit(JILS)」講演では、このGraphDBを用いる意義と、その新しいインプリメンテーションの一つである、Neo4jの活用が主題になりました。特にNeo4jの優れたアベイラビリティとスケールのしやすさ、豊富な機能、高速処理については強調されたところです。実例として、スタンフォード大学に用意されているデータセットをNeo4jに格納して、「R」などを用いてビジュアライズ化するプレゼンテーションも行われました。
最近のSNS系企業の技術セミナーで大規模データ処理技術がテーマになると、よく聞くのが、Hadoop、MongoDB、Tokyo Cabinet といった新しいツール類の活用事例です。そうした最新のテクノロジー志向のムーブメントのなかで、あえて歴史のあるGraphDBを持ち出したことが、講演のミソでもありました。「ここでGraphDBを紹介したので、おっと思われた人も多かったのではないでしょうか。何でもHadoopでやればいいというものではないと僕は考えています。ドメインに適した最適のアーキテクチャやツールがあるはずだし、それを見つけ出して活用することの面白さを訴えたかったんです」とmixiシステム本部 木村俊也氏は語ります。
本レポートでは、同社のソーシャルグラフ分析から見えてきたことや、データマイニングの実証研究についても詳しくレポートしています。
▼詳細は下記URLにてご覧ください。
http://rikunabi-next.yahoo.co.jp/tech/docs/ct_s03600.jsp?p=001984&vos=nyternns000000000001
―――――――――――――――――――――――――――――――――――
▼『Tech総研』の新着記事をお届け・メルマガ配信登録はこちら
http://rikunabi-next.yahoo.co.jp/tech/docs/ct_s04300.jsp?rfr_id=tmmrel&vos=nyternns000000000001
▼『Tech総研』Twitterアカウント
http://twitter.com/techsouken
▼『Tech総研』トップページ
http://rikunabi-next.yahoo.co.jp/tech/docs/ct_s01100.jsp?vos=nyternns000000000001
▼リクルートについて
http://www.recruit.co.jp/
―――――――――――――――――――――――――――――――――――
【本リリースに関するお問い合わせ】
https://www.recruit.jp/form/inquiry_press.php
―――――――――――――――――――――――――――――――――――