如何将html代码转换为Xml并生成Dom树

2025-04-06 13:59:21

推荐回答（1个）

回答1：

　　运用.NET Framework类来解析HTML文件、读取数据并不是最容易的。虽然你可以用.NET Framework中的许多类（如StreamReader）来逐行解析文件，但XmlReader提供的API并不是“取出即可用（out of the box）”的，因为HTML的格式不规范。
　　你可以用正则表达式（regular expression），但如果你对这些表达式运用不熟练，你可能开始时会觉得它们有些难。