使用ANTLR用C#解析C ++

我正在尝试使用ANTLR来获取C ++ AST,如果可能的话,从我的C#代码库中获取。

现在,基本的工作流程对我来说似乎很清楚:使用ANTLRWorks生成.cs lexer和解析器,将它们和ANTLR引用添加到C#项目,给它一个C ++源代码,使用结果数据结构。

但是,我已经在第二步失败了。 我从http://www.antlr.org/grammar/list下载了C ++语法(我试过Aurelian Melinte的“C ++语法”和Ramin Zaghi的“C ++语法和ANTLR 3.2代码跟踪器”)并生成了词法分析器和解析器C#设置“language = CSharp3;” 在语法的选项中。 但是,我无法编译包含解析器和词法分析器文件的C#项目。

一个问题是我不知道这是我使用的语法问题还是可用的版本问题……有很多不同版本的ANTLR,C#运行时和C#目标试图尝试每一个组合似乎是一个相当无望的任务。

但是,当前组合似乎工作正常,一个小例子语法只出现一个错误(c#lexer中的“HIDDEN”需要更改为“Hidden”,就是这样),但C ++解析器/词法分析器仍然给了我许多编译器错误,主要处理预处理程序指令和数组声明。

有没有人设法用ANTLR生成的C#文件解析C ++? 有谁知道这应该如何工作?

问题是两个语法都有嵌入式代码,而且代码是用C ++编写的。 嵌入式代码在复杂的语法中非常常见,因此您需要在C#中找到用于解析C ++的语法,而不是仅仅解析C ++。 作为旁注,如果您能够找到一个用Java解析C ++的程序,您可以使用IKVM从C#中使用它。

我见过的唯一一个用于C ++的ANTLR语法被作者抛弃为不完整,而他只是在尝试使用C ++ 98(YMMV)。 C ++ 11(是的,确实,C ++ 14)在这里并且复杂得多。 构建一个生产C ++ 真的很难,除非你能得到一个经过测试的版本,否则它可能不适用于真正的代码。

我建议您使用Clang,EDG C ++前端或我们的DMS软件重组工具包,所有这些工具包都具有强大的C ++解析器。 如果你想为某种目的操纵解析的C ++,你会需要比“纯粹”解析器更多的机器。