当前位置: 代码迷 >> PHP >> PHP CURL 采集新浪微博手机网页版遇到了有关问题
  详细解决方案

PHP CURL 采集新浪微博手机网页版遇到了有关问题

热度:178   发布时间:2016-04-28 18:30:44.0
PHP CURL 采集新浪微博手机网页版遇到了问题
我用 CURL 的方法的.
当前我已经可以成功访问到

<p>
登录成功!返回登录前的页面...
<br/>
如果没有自动跳转,请<a href="http://sina.cn?gsid=3_58a11724da59a0c7a4aec1380bbd2c8fce0a28a52c9eed&amp;PHPSESSID=5fb6e5d76e88d7fd1e3289c8f5d10457&amp;vt=1&amp;lret=1">点击这里</a>.<br/>

</p>

可获得此页面的源代码了.

按照此代码提示a 链接跳转将会又回去登陆界面

这里提供一下 Firefox 采集的 URL 跳转过程

[02:11:23.043] GET http://3g.sina.com.cn/prog/wapsite/sso/login.php?ns=1&revalid=2&backURL=http://weibo.cn/&backTitle=新浪微博&vt= [HTTP/1.1 200 OK 529ms]
--
[02:11:30.456] POST http://3g.sina.com.cn/prog/wapsite/sso/login_submit.php?rand=1087276267&backURL=http://weibo.cn/&backTitle=新浪微博&vt=4&revalid=2&ns=1 [HTTP/1.1 302 Found 229ms]
[02:11:30.664] GET http://login.sina.cn/prog/wapsite/sso/login_succ.php?url=http://weibo.cn/?gsid=3_58a11724da59a0c7a4aec1380bbd2c8fce0a28a52c9eed&vt=4&vt=4&r=1 [HTTP/1.1 200 OK 170ms]
[02:11:33.958] GET http://weibo.cn/dpool/ttt/crossDomain.php?g=3_58a11724da59a0c7a4aec1380bbd2c8fce0a28a52c9eed&t=1339092697&m=6606&r=1&u=http://weibo.cn/?gsid=3_58a11724da59a0c7a4aec1380bbd2c8fce0a28a52c9eed&vt=4&lret=1 [HTTP/1.1 302 Found 436ms]
[02:11:34.419] GET http://weibo.cn/?gsid=3_58a11724da59a0c7a4aec1380bbd2c8fce0a28a52c9eed&vt=4&lret=1 [HTTP/1.1 200 OK 3754ms]
[02:11:38.053] GET http://u1.sinaimg.cn/upload/2011/07/28/5337.gif [HTTP/1.1 200 OK 112ms]
[02:11:38.112] GET http://wp3.sina.cn/wap128/6816ab01jw1dtq4z4w40cj.jpg [HTTP/1.0 200 OK 161ms]
[02:11:38.136] GET http://wp4.sina.cn/wap128/6ffff2e2jw1dtq4xh31hpj.jpg [HTTP/1.0 200 OK 169ms]
[02:11:38.279] GET http://wp2.sina.cn/wap128/6b2b208ejw1dtq04m9ta5j.jpg [HTTP/1.1 200 OK 183ms]
[02:11:38.309] GET http://wp1.sina.cn/wap128/6683af06jw1dtq4p5hj7fj.jpg [HTTP/1.0 200 OK 282ms]
[02:11:38.314] GET http://u1.sinaimg.cn/upload/2011/08/16/5547.gif [HTTP/1.1 200 OK 55ms]
[02:11:38.320] GET http://wp4.sina.cn/wap128/89401758jw1dtih49auphj.jpg [HTTP/1.0 200 OK 109ms]
[02:11:38.706] GET http://wp1.sina.cn/wap128/684fd0aegw1dtq2a8224cj.jpg [HTTP/1.1 200 OK 143ms]
[02:11:38.710] GET http://u1.sinaimg.cn/3g/image/upload/0/62/203/18979/5e990ec2.gif [HTTP/1.1 200 OK 75ms]

使用 Chrome 捕捉的 POST 记录就不发送了.
裏面包含了敏感信息.
------解决思路----------------------
上次已经有人发过这样的问题了,好像没结果.
登录后从cookie解析出这个 地址 然后再提交到这个地址.
------解决思路----------------------
我也在看这个问题.
第一步提交之后 ,设置.sina.com.cn的cookie  返回一个重定向的信息,重定向至sina.cn
然后设置sina.cn的cookie,在重定向至weibo.cn,设置weibo.cn的cookie.这样weibo.cn 才登陆成功.但是我模拟访问重定向的地址,都返回失败.只有第一步成功返回信息,不知道是什么原因.
------解决思路----------------------
友情提示,楼主已经暴露了重要信息, 赶紧删帖吧。 哈哈。。。