`
hujin1979
  • 浏览: 78864 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论
文章列表
    作为一位软件工作者,我曾有机会不但设计并实现了Web应用程序,而且还评估/审核了一些Web应用程序。在复杂的、并且用JavaScript客户端封装的应用程序内,我经常遇到对用户输入信息执行大量检查的Web页面。即使HTML元素具 ...
  JavaScript 是一门众所周知的语言,它可以动态操作和访问 Web 页面的内容。采用 Rhino(JavaScript 的 100% 纯 Java 实现)之后,很多 Java 开发人员发现,JavaScript 也是一种快速构建和部署基于 GUI 的应用程序的优秀工具。本文是 alt.lang.jre系列的第 5 部分,在文中,developerWorks 的撰稿人 Michael Squillace 将向您简要介绍 Rhino 的基础知识,它是 Java 平台上的一种基于原型的 Java 语言的可替代品。 Rhino 是一种使用 Java 语言编写的 JavaScript 的开源实 ...
  我们尝试用org.cyberneko.html.parsers.DOMParser来全面细致的分析互联网上的网站,但事实上由于各种技术流派的盛行导致了千变万化的网站技术,也导致了我们想细致分析每个页面成了一种理想状态的事情。   但是,我们在能里和了解范围内还是希望把工作做得更周到,页面解析的类我写在一个叫ParseDocument.java的文件中,目前它能做到事情就是把取得的HTML代码进行分析,获取我们希望获得的数据并保存在对象中以供使用。我们还是先看看代码。  import java.io.StringReader; import java.lang.reflect.Const ...
  其实这个项目开始做在现在已经快一个月了,从中学习和发现的问题还是有点的。现在提供下载的版本已经可以扫描分析到国内外大多数,我估计应该90%以上的网站吧,呵呵 。   可以对页面10种预定义元素进行分析填充相关属性,并分析页面内包含的JavaScript脚本和引用的JS脚本,并可将几乎所有包含的事件写入到你想要分析的页面元素。   今天还构思出了对页面的IFRAME和FRAME的提取和分析,下一步将增加对AJAX的分析。 有兴趣的同志可以和我一起参与下一步,也是很重要的功能模块的设计,关于绑定元素事件后的脚本执行,我在HTMLELEMENT里面定义了两个抽象方法,每个元素子类都可以来实现对 ...
  该项目目的是给需要用java技术分析网站元素信息并可执行JS脚本的一个开发型的轻量级JAVA浏览器。为什么叫浏览器,是因为这个项目的最终目的是要向IE等浏览器看齐,当然这个任务是很复杂的。   首先你得先了解几个JAVA包的功能和特性。   HttpClient 是 Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient,然后根据作者实际工作经验给出了一些常见问题的解决方法。   1.HttpClient简介:   HTTP 协议可能是 ...
Global site tag (gtag.js) - Google Analytics