如何在C#中解析非常庞大的XML文件?

我正在使用dblp XML文件。 我实际上想要解析dblp.xml文件,并希望提取有用的信息以供我在某个项目中进一步处理。 并且该XML文件非常庞大(1.1 GB),我甚至无法打开此文件。

如果您有dblp.xml的C#解析器,请指导我,或者您可以指导我,或者我们如何解析大型xml文件。

使用XML reader而不是XML dom。 XML dom将整个文件存储在内存中,这完全没用:

http://msdn.microsoft.com/en-us/library/system.xml.xmlreader.aspx

您需要使用XmlReader

它代表一个读者,它提供对XML数据的快速,非缓存,仅向前访问。 不会将所有数据加载到内存中 ,应该与大量数据一起使用。 其他内置的.NET解决方案保留了完整生成的对象图。

XmlReader在行动(由Jon Skeet提供)