HTMLParse 2

Apache HTMLParserを使う場合。

final URL url = new URL("http://");
final URLConnection urlConnection = url.openConnection();
final Parser parser = new Parser(urlConnection);
final NodeList nodeList = parser.parse(null);

というURLを指定してurlConnctionから取得するやり方と、

final String path = servletContext.getRealPath("/pages/index.html");
final Parser parser = new Parser(path);
final NodeList nodeList = parser.parse(null);

のように絶対パスから取得する方法ができる。

Webアプリケーション内のファイルを読み込むは
http://www.itmedia.co.jp/enterprise/articles/0408/03/news020.html