这篇文章给大家介绍怎么在Android中利用orc实现一个文字识别功能,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。

创新互联建站专注于企业网络营销推广、网站重做改版、柳城网站定制设计、自适应品牌网站建设、HTML5、成都做商城网站、集团公司官网建设、成都外贸网站建设、高端网站制作、响应式网页设计等建站业务,价格优惠性价比高,为柳城等各大城市提供网站开发制作服务。
一、什么是orc
orc是指利用光学字符识别(ORC全称:Optical Character Recognition)技术,将图片、照片上的文字内容,直接转换为可编辑文本,支持JPG、PNG、GIF、BMP、DOC等图片格式。简单一句话,就是可以把图片上的文字识别出来。应用的场景有很多,比如说:身份证号码识别,银行卡号识别等等。
实现:
1.下载中文简体语言包
2.导入依赖
3.API的使用,获取TessBaseAPI mBaseAPI = new TessBaseAPI();实例
4.API的使用,初始化TessBaseAPI设置,设置识别的语言和语言包所在文件路径 mBaseAPI.init(path + File.separator, "chi_sim");
5.API的使用,设置Bitmap,mBaseAPI.setImage(bitmap);
6.API的使用,从Bitmap获取文字信息,mBaseAPI.getUTF8Text();
1.下载中文简体语言包
语言包下载地址
找到tessdata——>chi_sim.traineddata
下载好了之后,需要放到sd卡中,目录不限,但是必须要放在tessdata目录里面,如果没有tessdata目录需要手动创建,例如我是Demo中是放在sd卡根目录中,就直接在sd卡根目录创建tessdata目录,然后把下载好的chi_sim.traineddata语言包丢进去,实际项目中,在识别时候最好坐下语言包是否复制到位的检查,以免出现异常。Demo中仅仅是检查了是否创建tessdata目录,这里实际上仍然存在风险的。
2.导入依赖
Gradle方式添加:https://github.com/rmtheis/tess-two
3.MainActivity代码
public class MainActivity extends AppCompatActivity implements View.OnClickListener {
private TextView mTvInfo;
private TessBaseAPI mBaseAPI;
private ProgressBar mProbar;
private String path;
private RadioGroup mRadioGroup;
private RadioButton mRbtnIdCard;
private RadioButton mRbtnBankNumber;
private RadioButton mRbtnTxt;
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
findViewById(R.id.btn_start).setOnClickListener(this);
mProbar = (ProgressBar) findViewById(R.id.pb);
mTvInfo = (TextView) findViewById(R.id.tv_info);
mRadioGroup = (RadioGroup) findViewById(R.id.rg);
mRbtnIdCard = (RadioButton) findViewById(R.id.rb_idCard);
mRbtnBankNumber = (RadioButton) findViewById(R.id.rb_bankNumber);
mRbtnTxt = (RadioButton) findViewById(R.id.rb_txt);
mRadioGroup.check(0);
path = Environment.getExternalStorageDirectory().getAbsoluteFile().getAbsolutePath();
}
@Override
public void onClick(View v) {
mTvInfo.setText("");
switch (v.getId()) {
case R.id.btn_start:
if (Build.VERSION.SDK_INT >= 23) {
if (ActivityCompat.checkSelfPermission(this, Manifest.permission.WRITE_EXTERNAL_STORAGE) != PackageManager.PERMISSION_GRANTED) {
// 没有权限
if(ActivityCompat.shouldShowRequestPermissionRationale(this, Manifest.permission.CALL_PHONE)){
//如果没勾选“不再询问”,向用户发起权限请求
ActivityCompat.requestPermissions(this, new String[]{Manifest.permission.CALL_PHONE}, 0);
}else{
Toast.makeText(this,"请前往设置——>存储卡权限——>允许",Toast.LENGTH_SHORT).show();
}
} else {
// 有权限,接着你要干的活
startReadText();
}
}else{
startReadText();
}
break;
}
}
private Handler mHandler = new Handler() {
@Override
public void handleMessage(Message msg) {
switch (msg.what) {
case 0:
String s = (String) msg.obj;
if (!TextUtils.isEmpty(s)) {
mProbar.setVisibility(View.GONE);
mTvInfo.setText(s);
//释放bitmap
mBaseAPI.clear();
} else {
mProbar.setVisibility(View.GONE);
Toast.makeText(MainActivity.this, "识别图片内容失败", Toast.LENGTH_SHORT).show();
}
break;
case 1:
Toast.makeText(MainActivity.this, "读取图片失败", Toast.LENGTH_SHORT).show();
break;
}
}
};
private Bitmap getBitmap(int id) {
Bitmap bitmap = null;
try {
bitmap = BitmapFactory.decodeResource(getResources(), id);
} catch (Exception e) {
return null;
}
return bitmap;
}
/**
* 开始识别文字
*/
private void startReadText() {
File f = new File(path+"/tessdata") ;
if(!f.exists()){
Toast.makeText(this,"请先下载好语言包置于sd/tessdata目录",Toast.LENGTH_SHORT).show();
return;
}
final int btnId = mRadioGroup.getCheckedRadioButtonId();
final int resId ;
if(R.id.rb_idCard==btnId){
resId = R.drawable.idcard;
}else if(R.id.rb_bankNumber==btnId){
resId = R.drawable.bank_number;
}else{
resId = R.drawable.tet_info;
}
mProbar.setVisibility(View.VISIBLE);
new Thread() {
@Override
public void run() {
mBaseAPI = new TessBaseAPI();//初始化需要耗时,可以启动时程序时,预初始化
mBaseAPI.init(path + File.separator, "chi_sim");
Bitmap bitmap = getBitmap(resId);
if (bitmap == null) {
mHandler.sendEmptyMessage(1);
} else {
mBaseAPI.setImage(bitmap);
//根据Init的语言,获得ocr后的字符串
String t = mBaseAPI.getUTF8Text();//耗时操作
Message obtain = Message.obtain();
obtain.what = 0;
obtain.obj = t;
mHandler.sendMessage(obtain);
}
}
}.start();
}
}4.activity_main.xml代码
四、提高识别率
Demo识别率其实不是很理想,比如把数字0识别成了字母O等,这是因为我们的根本没有进行样本训练。关于样本的训练,我目前还没实际操作过,因为公司的识别需求更为复杂,这个框架难以达到效果,公司买了第三方的一个识别框架。不过仅仅是实现身份证号,银行卡号,和一些简单的文字信息,用这个框架足以实现。
关于怎么在Android中利用orc实现一个文字识别功能就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
网页标题:怎么在Android中利用orc实现一个文字识别功能
标题链接:http://www.jxjierui.cn/article/jchpdi.html


咨询
建站咨询
