又想起那无果而终的P2P阅读计划。想起所谓的Power-law,想起所谓的six-degree acquaintance,然后又想到QQ,想到抓包。要是抓QQ 空间呢?我可以把QQ空间上的信息提取出来,比如最近访问人,留言中的人名,连带访问的空间的主人,进一步的,这些主人的QQ资料,甚至,作为google、baidu搜索关键字后的结果,这样一来,依赖于QQ的资料和搜索引擎的数据,完全可以打造一张QQ关系网络,或者说是当代网民,尤其是青少年网民的关系网络,而基础设施的技术力量依然完全胜任!至于这张青少年关系网络有什么用处呢?似乎没有什么用处,我还不懂什么信息经济下的商业价值,不过,信息就是产量嘛,尤其是这种大规模的统计信息。在网络上,要获取这种人际关系的统计信息,建立一个海量的数据库好像还没有人来做或者还没有怎么应用;而在现实中,人际关系网络的一些显性脉络无非是依赖于通信侦听,比如最近拨打、接听电话,最近收发邮件,至于最近接触的人就不好做显性的统计了:( 而QQ这种关系网络,一个突出的特性是所有行为都是主动自愿的,也就是说,所有显现出来的联系,都是反映主人和联系人一种现实的关系的,没有什么自动化工具替你在别人的QQ上留言,也很少有人向发垃圾邮件一样跟一个完全与自己没有任何关系的QQ号码发表很多留言。总之,在QQ空间上统计的联系,都是真实的、有效的。这实际上得力于QQ空间的两条规则:
1、发表留言必须登陆,使用自己的QQ帐号,从使得留言成为一种带有双方“责任关系”的表征,即是“真实的”;
2、发表留言时必须输入验证码,从而使得留言是“反映个人意愿”的行为,不是采用自动化脚本所能替代的,即是” 有效的”。
这种想法很容易让技术派的人兴奋起来吧!可是,我对这些技术细节一窍不通,我还不知道如何在程序/脚本里面如何获取、请求指定网页中的信息,更不用说进一步的信息过滤和数据库优化技术,唉,又只能挂起了
1、发表留言必须登陆,使用自己的QQ帐号,从使得留言成为一种带有双方“责任关系”的表征,即是“真实的”;
2、发表留言时必须输入验证码,从而使得留言是“反映个人意愿”的行为,不是采用自动化脚本所能替代的,即是” 有效的”。
这种想法很容易让技术派的人兴奋起来吧!可是,我对这些技术细节一窍不通,我还不知道如何在程序/脚本里面如何获取、请求指定网页中的信息,更不用说进一步的信息过滤和数据库优化技术,唉,又只能挂起了
powered by performancing firefox