
我正在寻找快速的类来处理文本文件和舒适阅读不同的对象(像NextInt32,NextDouble,NextLine等方法)。 你能给我一些建议吗?

编辑:在我的情况下,BinaryReader是坏类。 我的数据格式不是二进制。 我有档案

1 2 3 FirstToken NextToken 1.23 2,34 


 int a = FileReader.NextInt32(); int b = FileReader.NextInt32(); int c = FileReader.NextInt32(); int d = FileReader.NextString(); int e = FileReader.NextString(); int f = FileReader.NextDouble(); int g = FileReader.NextDouble(); 


我将把它作为一个单独的答案添加,因为它与我已经给出的答案截然不同。 以下是如何开始创建自己的Scanner类:

 class Scanner : System.IO.StringReader { string currentWord; public Scanner(string source) : base(source) { readNextWord(); } private void ReadNextWord() { System.Text.StringBuilder sb = new StringBuilder(); char nextChar; int next; do { next = this.Read(); if (next < 0) break; nextChar = (char)next; if (char.IsWhiteSpace(nextChar)) break; sb.Append(nextChar); } while (true); while((this.Peek() >= 0) && (char.IsWhiteSpace((char)this.Peek()))) this.Read(); if (sb.Length > 0) currentWord = sb.ToString(); else currentWord = null; } public bool HasNextInt() { if (currentWord == null) return false; int dummy; return int.TryParse(currentWord, out dummy); } public int NextInt() { try { return int.Parse(currentWord); } finally { readNextWord(); } } public bool HasNextDouble() { if (currentWord == null) return false; double dummy; return double.TryParse(currentWord, out dummy); } public double NextDouble() { try { return double.Parse(currentWord); } finally { readNextWord(); } } public bool HasNext() { return currentWord != null; } } 

您应该准确定义文件格式的外观。 你会如何表示一个包含空格的字符串? 什么决定了线路终结器的去向?

通常,您可以使用TextReader及其ReadLine方法,然后使用double.TryParseint.TryParse等 – 但您需要先将格式固定下来。


 public static class TextReaderTokenizer { // Adjust as needed. -1 is EOF. private static int[] whitespace = { -1, ' ', '\r' , '\n', '\t' }; public static T ReadToken(this TextReader reader) { StringBuilder sb = new StringBuilder(); while (Array.IndexOf(whitespace, reader.Peek()) < 0) { sb.Append((char)reader.Read()); } return (T)Convert.ChangeType(sb.ToString(), typeof(T)); } } 


 TextReader reader = File.OpenText("foo.txt"); int n = reader.ReadToken(); string s = reader.ReadToken(); 


 public class TextTokenizer { private TextReader reader; private Predicate isDelim; private CultureInfo cultureInfo; public TextTokenizer(TextReader reader, Predicate isDelim, CultureInfo cultureInfo) { this.reader = reader; this.isDelim = isDelim; this.cultureInfo = cultureInfo; } public TextTokenizer(TextReader reader, char[] delims, CultureInfo cultureInfo) { this.reader = reader; this.isDelim = c => Array.IndexOf(delims, c) >= 0; this.cultureInfo = cultureInfo; } public TextReader BaseReader { get { return reader; } } public T ReadToken() { StringBuilder sb = new StringBuilder(); while (true) { int c = reader.Peek(); if (c < 0 || isDelim((char)c)) { break; } sb.Append((char)reader.Read()); } return (T)Convert.ChangeType(sb.ToString(), typeof(T)); } } 


 TextReader reader = File.OpenText("foo.txt"); TextTokenizer tokenizer = new TextTokenizer( reader, new[] { ' ', '\r', '\n', '\t' }, CultureInfo.InvariantCulture); int n = tokenizer.ReadToken(); string s = tokenizer.ReadToken(); 

你检查过BinaryReader类了吗? 是的,它是一个文本文件,但没有什么能阻止您将其视为二进制数据,因此使用BinaryReader。 它具有您正在寻找的所有方法,但ReadLine除外。 但是,在BinaryReader之上实现该方法并不困难。


您可以使用TextReader ,但与BinaryReaderTextWriter不同,它不支持除Line和char之外的任何类型。 您必须定义允许的分隔符并自行解析Line基础数据。



 public static class Extensions { public static String ReadLine(this BinaryReader binaryReader) { var bytes = new List(); byte temp; while ((temp = (byte)binaryReader.Read()) < 10) bytes.Add(temp); return Encoding.Default.GetString(bytes.ToArray()); } } 


 string line = String.Empty; while( (line = file.ReadLine()).IsNullOrEmpty() == false ) { TYPE value = Convert.ToTYPE( line ); } 



 string[] parts = line.Split(' '); if( parts.Length > 1 ) { foreach( string item in parts ) { TYPE value = Convert.ToTYPE( item ); } } else { // Use the code from before }