C#: 网站 HTML 内容解析-如何从网站获取所需信息
资 源 简 介
翻译 maninwest@Codeforge 作者:Emiliarge@CodeProject 如果获取和解析网站内容 如何从网站中获取内容?有 3 个方法:1.使用浏览器引擎打开,即标准的 Web浏览器或者第三方引擎 并获得页面的 DOM 元素。2.通过 System.Net.Web 客户端下载 HTML内容,之后通过 String.IndexOf()/Substring,正则表达式或者 HtmlAgilityPacklibrary 解析。3. 使用网站 API (如有): 发送查询到 API并获得响应,也使用 System.Net.Web客户端或其他 System.Net 类。方法 1 - 通过浏览器引擎例如,一个天气预报网站有如下 HTML 内容:
文 件 列 表
Weaver site parsing
bin
Form1.cs
Form1.Designer.cs
Form1.resx
obj
Program.cs
Properties
Weaver site parsing.csproj
Weaver site parsing.csproj.user
Weaver site parsing.sln
Weaver site parsing.suo