在使用WebClient或是WebRequest对一个网址的进行源码抓取的时候。
如果是正常的网页没有问题,不过如果网页中有javascript的错误时,
就有可能不是完整的网页了,请问如何忽略这些脚本错误,最后再进行抓取呢,
非常感谢,很难解决的样子。
楼主说的问题,前几天我也遇到过
有个网页是三秒后才开始执行还是怎么着来,反正抓取网页源代码的时候,只得到了那一点东东,就是还没执行时候的
没有解决
我用AxWebBrowser下载,然后用mshtml分析,就遇到这个问题。我也想知道这个问题怎样解决。
用WebClient或WebRequest抓取html,仅仅是抓取Html,而没有执行Html代码,应该不会出现这样的问题啊???
严重关注。
疑问?
服务端吐给(Response.Write)客户端的数据,是包括javascript的html代码. HttpWebResponse 仅仅是得到这些字符串, 不可能去执行javascript吧
我也想知道如何抓取网页源码.
原来我用System.Net.Sockets,
string Get = "GET / HTTP/1.1\r\nHost: " + "club.zhjnc.cn" +
"\r\nConnection: Close\r\n\r\n";
Byte[] ByteGet = ASCII.GetBytes(Get);
.....
只能得到首页的代码,
string Get = "GET /内页.asp HTTP/1.1\r\nHost: " + "club.zhjnc.cn" +
"\r\nConnection: Close\r\n\r\n";
Byte[] ByteGet = ASCII.GetBytes(Get);
....
得不到正确的页.
我想知道你是怎样做的?
我也用过AxWebBrowser下载,然后用mshtml分析,但是这样会浪费很多时间的.