mixiのユーザーのプロフィールを外部へ持ち出し、データベース化するシステムは作成可能

  • 2007/07/26
  • このエントリーをはてなブックマークに追加

スポンサーリンク

(2007/7/29 11:11更新)
追加記事は記事の最後に

全国のmixiユーザー達。

SNSとは?と聞かれて答えれますか?
閉鎖的?小規模日記?

そんなのは昔の話。
そろそろプロフィールに本名を、何も考えずに入力する事についてちゃんと考えてください。

なぜか?

プロフィールはmixiアカウントを持っていない人でも、ある方法で見れるからです。

え?なんて今更聞かないでくださいね。
会員数1000万人突破している時点で、プロフィールを全体に公開している人は居ますけど、そんな規模じゃありません。

インターネットユーザー全てが、あなたのプロフィールを見ることが出来ます。(今のところ)

IT/Web業界に強い転職サイトGreen

簡略的に次のようなシステムを構築します


【使うもの】
http://mixilabo.com/index.cgi?fn=get_friend_home&id=
・PHP(私がPHPユーザーだから)

作業を簡略化させるため、ミクシーマイザーをAPIにしてシステムに組み込む。

ためしにid=のあとに適当に数字入れてみるとわかります。
会員数が1000万人分の数字入力が可能。

既に退会している人もいるけど1~10000000まで適当に入力していけば、プロフィール画面をミクシーユーザーじゃなくても確認できるのがわかります。

何件か適当に数字を入力するとわかりますが、所在地と本名の公開している人の数は膨大です。これは非常に危険な状態であると考えてください。

プログラムの中で、$url に数字を入れたURLを渡し
$string=file_get_contents($url);
これで情報を採取します。

採取した情報をエンコードし、
$pattern = "/<h1[^>]*>(.*?)<\/h1>/i";
$result = preg_replace_callback($pattern, "toh1", $string);
こういう特定箇所抜き出しを行えば、名前や所在地だけを抜き出すことが可能。
(※これはh1タグの中の文字を抜き出すプログラムのサンプルで、直接これを使っても名前を抜き出しません。作成されるときはご自身で法則を発見しそれように変更を加える必要があります)

ミクシーマイザーAPIを使って採取できる範囲は限られているけど、名前、ハンドルネーム、マイミク9人まで、紹介者は採取できると考えられる。
また、全体に情報を公開しているユーザーは、所在地(市町村)まで同時に採取される。

さらに参加しているコミュニティーも同時に抜かれる。


これらの情報を自分のデータベースに保存する。

これを例えば1~100まで、100回繰り返す。
すると、名前検索が可能となる。

この時点で、所在地を全体に情報を公開し、さらに実名を使っている場合は、高確率で個人を特定される恐れが強い。

さらに、データベース化を簡単にできると言う事は、全体に公開していないユーザーも、個人を特定できる要素が生まれる。


データベースが100万件になったとき


ミクシィプロフィールが100件のデータベースを入手したとき、次のようなリレーを行う事が出来る。

1)マイミクの連結
マイミクに登録されているハンドルネーム一覧からそのマイミクの連結が可能となる。
あなたが所在地を公開していなくても、マイミクが公開していた場合、ある程度の予測が可能となってしまう。

2)コミュニティーの連結
コミュニティーにも、実は所在地を特定させる要素もある。
また、出身校などのコミュニティーも個人を特性させる要素に変化する。

3)所在地検索が可能になる
全体に公開しているユーザーだけの検索が可能になる。
検索窓に、北海道と入力すれば、全体に所在地を公開している人の一覧が登場し、そこに本名があれば、ほぼ確実に個人を特定される。

これだけでも相当なリスクを背負うことになるのが全体への公開だ。
それ以上にさらに考えられるネガディブな想像を膨らませてみる。


趣味、趣向なども採取可能


ブログアドレスをmixiプロフィールに公開している人も、個人の特定をされる。

ブログで公開した内容と、参加しているコミュニティー。
そして、日記のタイトル(全体に公開している人)の3つを連結させると、ある程度その人の趣味や、趣向なども見えてくる。

あなたの趣味や、仕事なんかも見ず知らずの人に持っていかれるのだ。

あなたが大好きなアーティストのコミュニティーに参加している事がわかれば、あなたに対して最も効果的な広告を提供するのも簡単だ。


内部からの情報持ち出しはもっと怖い


これに関しては前回書いた記事。
mixiを徘徊しているロボット達。あなたのマイミクは本当に人間か?*を見てもらえればわかるけど、より個人を特定されやすい。

是非とも楽しいmixiライフの為に、本名の公開だけは避けたほうが良いと警告させて頂きたい。

では。

追記
この記事で紹介した方法は現在使えません。
本記事を公開してから1日で内部からの情報送信を行っていたmixiユーザーのアカウントが消されたためです。

流石ミクシィです。


スポンサーリンク

トップへ戻る

Twitter版のネタ帳では毎週月曜~金曜までWeb屋さんに役立つ色んな情報や単なるネタまでをつぶやいています。

関連するエントリー

コメント

この記事にコメントする人はクリック

コメントポリシーをお読みください
管理者にだけ表示を許可する

hg これはいい搾取ですね

"逆に"
マーケティング以外にも趣味とかでも使えそうですね。

往々にして素人が本名やら所在地やら書いてるのが多いわけですが
そういう人たちは痛い目見て勉強してくださいってことですかね。

2007/07/26 Thu 11:02| |

おやじです mixiの規約

とかにひっかからないのかなー。こういうことって思う。
mixilaboの件、事務局に問い合わせている人もいるみたいだけど
未だに返答もアナウンスもないらしい。大丈夫か?mixi。

2007/07/26 Thu 11:48| |

&y 規約

少なくともDB化は禁止されていますよ。

2007/07/26 Thu 12:59| |

タロウ 個人を特定されると、

なにか都合が悪いことでもあるのでしょうか。

2007/07/26 Thu 14:25| |

名前を名乗れない人

結局、アカウント使ってログインしているだけじゃないですか。

1000万回人が頑張って見回るのと一緒。

ただ、それをプログラムにさせたということでしょ。

これをミクシィのアカウント持っていない人に公開するのは
アカウントを他人に教えていると同義、規約にひっかかりそうだね。

2007/07/26 Thu 14:44| |

名前を名乗れない人 所在地と本名がわかると

どうして「非常に危険な状態」なのですか?

2007/07/26 Thu 18:34| |

ビタミン

色々できるんですね…。

よくSNSで何人突破とかありますけど、実際どうなんでしょうね。
Mixiのアカウントなんて、1人でたくさん持ってる人多いでしょうし…。

2007/07/26 Thu 18:36| |

幸之介 > 都合が悪いこと

個人特定可能状態であることを本人が認識していれば現実的な危険はないでしょう。しかし特定されると思っていない日記などには都合の悪いものもあるかもしれないね。

とはいえこの記事の煽り調子はどうかと思う。

2007/07/26 Thu 19:48| |

圧力鍋

「匿名にしていれば安全、実名は危険」というのは一見もっともそうでいて実は無根拠ですね。以前はNetNewsでもWebでも実名を開示して発言するのが当たり前だったのですが、そういう記憶は急速に薄れつつあるのでしょうか。

2007/07/26 Thu 21:00| |

yu はじめまして

mixiからこのブログを拝見しました。
皆さんが個人を特定されないことについて、別に問題ないというようなコメントがあるのですが、私はとても嫌なことだと思います。
妹が実名で公開して、嫌な目にあったこともありますので、本当にそう思います。

この記事を見ても私は難しいことはわかりませんが、そういう事が出来るという事がわかっただけでも大変勉強になりました。
ありがとうございます。

2007/07/26 Thu 22:39| |

ひかる 本名公開はいい場合と悪い場合が

連絡が途絶えてた人と再会できた。なんていい面もあれば、見知らぬ誰かに付けねらわれたなんて悪い面も。
でもこれはネットに限ったことではありませんが、とりわけネットが簡単にかつ大量に個人情報を入手しやすいということでしょうね。
リスクもあるという意識はもっていたほうがいいと思います。あとは自己責任ですね。

2007/07/27 Fri 01:18| |

名前を名乗れない人

mixi 運営者に連絡しても改善がみられなかったから公開したのでしょうか。

一部ソースコードまで公開し、WEBアプリケーションを組めるPGなら誰でも実装可能な状態にすることがどういうことか、ご存じのはずです。

mixi のプロフィールが取得できるらしいレベルで済ませてほしかったものです。

2007/07/27 Fri 09:44| |

hg 男性の方は

>所在地と本名がわかると
>どうして「非常に危険な状態」なのですか?

本気で言っているのでしょうか・・

2007/07/27 Fri 16:32| |

マロン これはちょっと

怖いですね・・・(つд⊂)

2007/07/28 Sat 00:07| |

G できませんよ

やってみたけどできないですね。

嘘ですか?

2007/07/31 Tue 00:48| |

名前を名乗れない人 完全に消えてないですね

http://mixilabo.com/index.cgi?ln=id&pw=password&fn=login
をすれば、まだ足あとだけ取得できそう。

2007/07/31 Tue 13:58| |

名前を名乗れない人 だから・・・

そもそも個人情報がどうとかよくも判ってないのに騒ぎすぎな風潮。ぎゃくにいうと閉鎖空間だから許されるとか思うのも平和ぼけ過ぎ。

実名・代替の所在判りましたが何か?

という振る舞いをしていれば良いだけの話し。論点ずれ。

2008/02/07 Thu 16:33| |

トラックバック

この記事にトラックバックする人はクリック

ミクシィを本名で登録するのは・・・

知り合いをmixiに招待する時は、本名での登録とプロフィールを公開しすぎないようにと言ってます。してしまったために えらい目にあった人もいますし・・・今回は関連する記事があったのでブログでも載せてお

なべもののブログ(パソコン相談所):2007-07-26 17:54

ホーム/2007-07-27

おはようございます。 いやぁ~~~~アツ━━━━(´Д`υ)━━━━・・・。昨日本格的にクーラーをつけてしまった; title([[]]) mixiのユーザーのプロフィールを外部へ持ち出し、データベース化するシステムは作成可能(これはひどい) 本名書くのはやめようね。というか

とんかつ3号 隠れ亭:2007-07-27 06:53

mixi 会員数

mixiのユーザーのプロフィールを外部へ持ち出し、データベース化する ...なぜか? プロフィールはmixiアカウントを持っていない人でも見れるからです。 え?なんて今更聞かないでくださいね。 会員数1000万人突破している

mixiで遊ぶ!!:2007-07-31 14:56

mixi プロフィールのご紹介

mixiのユーザーのプロフィールを外部へ持ち出し、データベース化する ...全国のmixiユーザー達。 SNSとは?と聞かれて答えれますか? 閉鎖的?小規模日記? そんなのは昔の話。 そろそろプロフィールに本名を、何も考えずに

稼げる情報!ミクシィクエスト2【mixiQuest2】をご紹介!:2007-08-07 07:38

FC2Ad

広告


IT・Web業界の求人なら転職サイトgreen(グリーン) ホームページテンプレート、WordPressテーマ、Facebookページテンプレートならクラウドテンプレート ネットマーケティングとは│ネットマーケティング検定 SEOコンサルティング&SEO対策 無料レスポンシブWebデザインテンプレート 広告主募集

あわせて読みたい
フィードメーター - ホームページを作る人のネタ帳

人気の記事一覧

あなたのブログの再訪問者を増やす50の方法

私の経験から感じた事を書き記します。全てが全てその時々で、正しいとは限りませんが、一つの指針としてお使いください。因みに全部リスト化すると230くらいありましたが、それはきっとセミナーとかでやるかなぁと。

http://e0166.blog89.fc2.com/blog-entry-824.html

あなたの生活を確実に拘束し時間を浪費させる動画50

今回は生産性を向上させる事ばかり考えて記事を書いてきたので、逆に年末にかけて忙しい皆さんの時間を出来るだけ拘束し、忙しさを倍増させるものが無いかを考えました。その結果、動画で行こうと言う事になったのが1ヶ月以上前。動画閲覧本数はおそらく600本以上。その中から、おもしろそうなものを50個ベストチョイスいたしました。

http://e0166.blog89.fc2.com/blog-entry-820.html

webデザインのセンスを磨く○○系のwebデザインまとめ

webデザインを学ぶならwebデザインから。と言うわけで、今回は海外のエントリを中心に、○○系のまとめをまとめます。

http://e0166.blog89.fc2.com/blog-entry-817.html

jQueryプラグインのベストトレンド総まとめ2010

もはやこの業界ではかなり浸透しつつあるjQuery。今回はそんなjQueryにスポットを当て、本年度紹介された中でも、ホットなトレンドプラグインをご紹介します。

http://e0166.blog89.fc2.com/blog-entry-816.html

ツイッターの日常における35の行動パターン

私が良く見かける35の行動パターンに名前をつけてみようと思う。年末の誰も見てない時に公開しようと思っていた、ただのネタだったのですが、結構時間がかかりこの時期に・・・。

http://e0166.blog89.fc2.com/blog-entry-823.html

ウェブデザイナーのためのウェブアプリ15

OSがWindowsであろうと、ubuntuであろうと、共通のサービスを受けることができるのがウェブアプリケーションです。ウェブデザイナーの中には、自宅ですでにubuntuを利用している人も多い。また、Mac、Windowsと、各自それぞれの使いやすい物を利用していると思います。

http://e0166.blog89.fc2.com/blog-entry-784.html

愛用するGoogleChromeエクステンション12個

この2年でノートPC2台購入。自他のPCはクラッシュしてリカバリー。会社のPCは新しいのがあたり、再セットアップ。そんなこんなで、会社はまぁともかくとして、とりあえず全PCが比較的3ヶ月に一度リカバリーしてもいいように、自分用にメモとして残しておきます。

http://e0166.blog89.fc2.com/blog-entry-784.html

文章や会話のプレゼンテーションを向上させる方法

文章力がないためにプレゼンに失敗した、会話がうまくできずにプレゼンに失敗した。こういう経験はなかなか無い。なぜなら多くの場合、失敗したことに気がつかないからです。

http://e0166.blog89.fc2.com/blog-entry-802.html

サイトの裏側の意識を変え売り上げをアップする方法

ネットショップ運営者が、あることをちょっとだけ始めてみただけでわずか5ヶ月で売り上げが3倍になりました。はたして、webサイト運営がどのように変わったのでしょうか。。

http://e0166.blog89.fc2.com/blog-entry-749.html

webサイトのリピーターを増やすさりげない5つのコツ

多くのビジネスサイトのアクセス数を支えている大手検索サイト、Yahoo、Googleのアルゴリズムが変わる事で、突然商売がひっくり返る事態を回避する方法。

http://e0166.blog89.fc2.com/blog-entry-746.html