C#将图片里中文识别成文本文字,中文识别,.net 实现中文识别 支持*.bmp; *.jpg; *.gif; *.jpeg;*.png等图片格式上的中文,文字 识别 【核心代码】 public Form1() { InitializeComponent(); //ocr = new TesseractEngine("./tessdata", "eng", EngineMode.TesseractAndCube);//设置语言 英文 ocr = new TesseractEngine("./tessdata", "chi_sim");//设置语言 中文 // ocr = new TesseractEngine("./tessdata", "jpn");//设置语言 日语 } private void button1_Click(object sender, EventArgs e) { OpenFileDialog filename = new OpenFileDialog(); filename.Filter = "All files(*.*)|*.*|image files(*.bmp)|*.bmp; *.jpg; *.gif; *.jpeg;*.png"; filename.FilterIndex = 2; if (filename.ShowDialog() == DialogResult.OK) { Bitmap bit = new Bitmap(Image.FromFile(filename.FileName.ToString())); Page page = ocr.Process(bit); string str = page.GetText();//识别后的内容 page.Dispose(); pictureBox1.Image = bit; richTextBox1.AppendText(str); } } ///
/// 图片颜色区分,剩下白色和黑色 /// ///
///