| 网站首页 | 文章中心 | 电子书下载 | 矢量图库 | 视频教程 | 素材下载 | 程序代码下载 | JS代码 | 论坛 | 
常用软件类:
|杀毒安全 |联络聊天 |网络软件 |多媒体类 |系统工具 |图形图像 |系统工具 |应用软件 |行业软件
开发设计类:
|动画制作 |图像处理 |3D设计 |操作系统 |站长学院 |网络相关 |WEB设计 |数据库类 |程序开发
ASP技术网站静态页面生成及网站数据采集的攻防
作者:佚名    文章来源:网络    点击数:    更新时间:2006-12-19
 


  采集程序的主要步骤如下:
  一、获取被采集的页面的内容
  二、从获取代码中提取所有用的数据
  一、获取被采集的页面的内容
  我目前所掌握的ASP常用获取被采集的页面的内容方法:
  1、用serverXMLHTTP组件获取数据
  ’-----------------翟振恺(小琦)
  ’创建对象
  Dim ObjXMLHTTP
  Set ObjXMLHTTP=Server.CreateObject("MSXML2.serverXMLHTTP")
  ’请求文件,以异步形式
  ObjXMLHTTP.Open "GET",weburl,False
  ObjXMLHTTP.send
  While ObjXMLHTTP.readyState <> 4
  ObjXMLHTTP.waitForResponse 1000
  Wend
  ’得到结果
  GetBody=ObjXMLHTTP.responseBody
  ’释放对象
  Set ObjXMLHTTP=Nothing
  ’-----------------翟振恺(小琦)
  End Function
  调用方法:
  GetBody(文件的URLf地址)
  2、或XMLHTTP组件获取数据
  CODE:[Copy to clipboard]Function GetBody(weburl)
  ’-----------------翟振恺(小琦)
  ’创建对象
  Set Retrieval = CreateObject("Microsoft.XMLHTTP")
  With Retrieval
  .Open "Get", weburl, False, "", ""
  .Send
  GetBody = .ResponseBody
  End With
  ’释放对象
  Set Retrieval = Nothing
  ’-----------------翟振恺(小琦)
  End Function
  调用方法:
  GetBody(文件的URLf地址)
  这样获取的数据内容还需要进行编码转换才可以使用
  CODE:[Copy to clipboard]Function BytesToBstr(body,Cset)
  ’-----------------翟振恺(小琦)

dim objstream
  set objstream = Server.CreateObject("adodb.stream")
  objstream.Type = 1
  objstream.Mode =3
  objstream.Open
  objstream.Write body
  objstream.Position = 0
  objstream.Type = 2
  objstream.Charset = Cset
  BytesToBstr = objstream.ReadText
  objstream.Close
  set objstream = nothing
  ’-----------------翟振恺(小琦)
  End Function
  调用方法:BytesToBstr(要转换的数据,编码)’编码常用为GB2312和UTF-8

上一页  [1] [2] [3] [4] 下一页


相关文章