The*_*boy 1 html java html-parsing
我正在编写一个连接到网站的java程序,它返回HTML,由于某种原因我遇到了问题.现在我只能访问该网站
//example String host = "www.google.com"
Run Code Online (Sandbox Code Playgroud)
但如果我想访问一个更复杂的URL,那么我得到一个UnknownHostException.起初我以为它可能与它有关,但没有识别URL中的某些字符,但我不确定.例如,这是我尝试访问的URL之一.
host ="http://www.cyberspacei.com/englishwiz/library/name/etymology_of_first_names.htm";
int port = 80;
Socket s = new Socket(host,port)
Run Code Online (Sandbox Code Playgroud)
....等等
它除了UnknownHostException之外不会返回任何内容.
有人请帮帮我!!!
它是失败的,因为你被问及主机名,而不是你输入的URL,如果你想要该URL中的文档,你需要使用URL类
URL url = new URL("http://www.thesite.com/thefile.html");
Object doc = url.getContent();
Run Code Online (Sandbox Code Playgroud)
当然,您需要将"Object doc"替换为准备缓存该内容的文件.
| 归档时间: |
|
| 查看次数: |
185 次 |
| 最近记录: |