您能用Google的协议缓冲区格式表示CSV数据吗？

我最近发现了协议缓冲区，并想知道它们是否可以应用于我的具体问题。

基本上我有一些CSV数据，我需要转换为更紧凑的格式存储，因为一些文件是几个演出。

CSV中的每个字段都有一个标题，只有两种类型，字符串和小数（因为有时会有很多有效数字，我需要以相同的方式处理所有数字）。但是每个文件的每个字段都有不同的列名。

除了捕获原始CSV数据外，我还需要在保存之前向文件中添加额外信息。我希望通过处理不同的文件版本来certificate这一点。

那么，是否可以使用协议缓冲区来捕获随机数量的随机命名数据列，如CSV文件？

嗯，这肯定是可以代表的。就像是：

message CsvFile { repeated CsvHeader header = 1; repeated CsvRow row = 2; } message CsvHeader { require string name = 1; require ColumnType type = 2; } enum ColumnType { DECIMAL = 1; STRING = 2; } message CsvRow { repeated CsvValue value = 1; } // Note that the column is implicit based on position within row message CsvValue { optional string string_value = 1; optional Decimal decimal_value = 2; } message Decimal { // However you want to represent it (there are various options here) }

我不确定它会提供多少好处，请注意……您当然可以添加更多信息（添加到CsvFile消息），以及将来的校对是“正常的PB方式” – 只添加可选字段等。

好吧，protobuf-net（我的版本）基于常规的.NET类型，所以没有（因为它不会一直处理不同的模式）。但Jon的版本可能允许动态类型。就个人而言，我只是使用CSV并通过GZipStream运行它 – 我希望这样可以达到目的。

编辑：实际上，我忘记了：protobuf-net确实支持可扩展对象，但你需要小心一点……这将取决于完整的上下文，我期待。

加上Jon的嵌套数据方法也可能有用。

您能用Google的协议缓冲区格式表示CSV数据吗？

使用x509证书签署xml文档

MVC 4 Connectionstring到SQL Server 2012

DataGridView Masked TextBox列

最佳resize和/或裁剪逻辑

从’foreach’中有效删除项目

模拟entity framework数据库

EntityFramework LINQ查询计数失败，但查询返回结果。如何优化LINQ查询？

使用ServiceStack上传图像文件

Quartz.Netdependency injection.Net核心

如何将文件移动到回收站

您能用Google的协议缓冲区格式表示CSV数据吗？

使用x509证书签署xml文档

MVC 4 Connectionstring到SQL Server 2012

DataGridView Masked TextBox列

最佳resize和/或裁剪逻辑

从’foreach’中有效删除项目

模拟entity framework数据库

EntityFramework LINQ查询计数失败，但查询返回结果。 如何优化LINQ查询？

使用ServiceStack上传图像文件

Quartz.Netdependency injection.Net核心

如何将文件移动到回收站

EntityFramework LINQ查询计数失败，但查询返回结果。如何优化LINQ查询？