brain burst 关于QQ空间的奇想一则_综合

又想起那无果而终的P2P阅读计划。想起所谓的Power-law，想起所谓的six-degree acquaintance，然后又想到QQ，想到抓包。要是抓QQ 空间呢？我可以把QQ空间上的信息提取出来，比如最近访问人，留言中的人名，连带访问的空间的主人，进一步的，这些主人的QQ资料，甚至，作为google、baidu搜索关键字后的结果，这样一来，依赖于QQ的资料和搜索引擎的数据，完全可以打造一张QQ关系网络，或者说是当代网民，尤其是青少年网民的关系网络，而基础设施的技术力量依然完全胜任！至于这张青少年关系网络有什么用处呢？似乎没有什么用处，我还不懂什么信息经济下的商业价值，不过，信息就是产量嘛，尤其是这种大规模的统计信息。在网络上，要获取这种人际关系的统计信息，建立一个海量的数据库好像还没有人来做或者还没有怎么应用；而在现实中，人际关系网络的一些显性脉络无非是依赖于通信侦听，比如最近拨打、接听电话，最近收发邮件，至于最近接触的人就不好做显性的统计了:( 而QQ这种关系网络，一个突出的特性是所有行为都是主动自愿的，也就是说，所有显现出来的联系，都是反映主人和联系人一种现实的关系的，没有什么自动化工具替你在别人的QQ上留言，也很少有人向发垃圾邮件一样跟一个完全与自己没有任何关系的QQ号码发表很多留言。总之，在QQ空间上统计的联系，都是真实的、有效的。这实际上得力于QQ空间的两条规则：
1、发表留言必须登陆，使用自己的QQ帐号，从使得留言成为一种带有双方“责任关系”的表征，即是“真实的”；
2、发表留言时必须输入验证码，从而使得留言是“反映个人意愿”的行为，不是采用自动化脚本所能替代的，即是” 有效的”。

这种想法很容易让技术派的人兴奋起来吧！可是，我对这些技术细节一窍不通，我还不知道如何在程序/脚本里面如何获取、请求指定网页中的信息，更不用说进一步的信息过滤和数据库优化技术，唉，又只能挂起了