我用的网页分析工具是jsoup-1.5.2.jar,http://www.open-open.com/jsoup/是它的API,可以试试吧。若有更好的工具望楼主分享!
nutch 网络jspider如果你界面化,比较傻瓜式的爬虫,可以去看看一个叫 “火车头” 的软件
httpclient