Capturando o conteúdo de uma página com Java através de um Proxy com usuário

menor que 1 minutos de leitura

Atualizado em:

Este código captura o conteúdo de uma página HTML para manipulação no Java, com destaque para a configuração de proxy, com endereço, porta, usuário e senha.

import java.io.IOException;
import java.io.InputStream;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;
import sun.misc.BASE64Encoder;

public class GetURLProxy {

public static void main(String args[]) throws MalformedURLException, IOException {

//Edite

String usuario = "";
String senha = "";
String host = "";
String porta = "";
String endereco = "http://www.google.com.br";

/////////////////////////

URL url = new URL(endereco);

String conteudo = "";

System.setProperty("http.proxyHost", host);
System.setProperty("http.proxyPort", porta);

String usuarioSenha = usuario + ":" + senha;

URLConnection con = url.openConnection();
String encodedLogin = new BASE64Encoder().encode(usuarioSenha.getBytes());
con.setRequestProperty("Proxy-Authorization", "Basic " + encodedLogin);
con.setDoInput(true);
con.setDoOutput(true);
con.setAllowUserInteraction(false);

InputStream in = con.getInputStream();

for (int b = in.read(); b != -1; b = in.read()) {
char[] temp = Character.toChars(b);
conteudo += temp[0];
}

System.out.println(conteudo);

}
}

Deixe um comentário