ocr表格识别训练检测
目标检测效果经过一段时间的训练,精度达到了百分之76.5,还是无法达到精准的表格预测的效果,于是我尝试下载表格数据集在此基础上进行预测。目前预测效果还是不够好。
文字识别模型效果用的是cnnr模型,效果提升不大
表格检测模型我下载了onedrive上的testbank的表格数据集。目前testbank数据集非常大,解压后有25g的大小以及Py这里的表格检测用的是testbank + publaynet数据集,加载一起有50g的数据集,整合为infer的推理模型后,效果还可以。我觉得目前做的效果不可能比paddle更好了
表格基本样式训练模型为ppyolov2_r50vd_dcn_365e_tableBank_word,
比起传统的Opencv处理方式会好很多
n卡驱动+cuda+cudnn避坑详尽过程
ubuntu20.04ok第一次安装的时候使用的是ubuntu18.04,后来发现还是会报错,索性用20.04,毕竟20.04屏幕看上去舒服漂亮多了。cuda还是装10.1,cudnn7.6.5
显卡驱动安装我之前用的都是
1sudo apt-get install nvidia-driver-418
之后会安装成功
还有一种方式是用touchpad的附加驱动安装
这里选择应用修改即可
但是使用nvidia-smi会显示
1NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver
这里的报错解决是通过
12ll /usr/src/sudo apt-get install dkms
看到驱动是418.211
因此使用
1sudo dkms install -m nvidia -v 418.211.00
装完之后重启,我还改了bios
以及禁了nouveau驱动
通过
1sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
...
去除图片印章尝试
关于印章去除的尝试对于红色印章,去除方式是比较简单的。
网上能够搜索到的方式基本都是基于红色通道的去除,还是通过直方图找到最佳阙值threshold来二值化
先对rgb不同通道来绘图,可以发现不同通道对于红色的敏感度不同
绘图红色通道的直方图
找出红色值的阙值范围,可以去除图片的印章,去除效果如下:
基于google识别的图形处理再处理完发票后,我通过安装了pytesseractOCR进行了文字识别。
并且使用opencv的box方法对每张图的小格进行了绘制,效果如下:
目前文字的处理效果还不够好,识别出的文字如下
12345678910111213141516171819202122232425262728293031发票代码: 012001900211发村号码: 25484924日期: 2019年12月11日支 验 码: 05988 47634 16531 55207机器编号: 499099606293购 |名 称: 个人报销 | 0301226+<42+01515108457<-4/买 | 纳税人识别号 ...
1.锅巴开始做游戏之打砖块实现
前言
一直很想做游戏很久了,决定开始做一些小项目。本项目基于js编写,需要的函数参考webapi文档,考虑之后改写成其他版本
从读取图片开始想画图先写一个读图函数,实现最基本的读取图片功能。
12345var readImage = function(imgpath){ var img = new Image() img.src = imgpath return img}
如何画图参考官方文档
123456789101112131415161718192021222324const canvas = document.getElementById('canvas');const ctx = canvas.getContext('2d');##通过选择器选择画布const image = new Image(60, 45); // 文档设定了图形的sizeimage.onload = drawImageActualSize; // 图片载入成功后画图// Load an image of intrinsic size ...
js实现的打弹幕游戏
js游戏开发有场景变换,子弹碰撞计算,分数计算等功能
人物自己找的东方project的人物,boss是通过random函数随机选择boss库,并随机生成boss的所在位置
操作wsad移动,按j发射子弹
游戏链接
js的flapp bird游戏
js游戏开发使用canvas绘制图,动画采用的方式是逐帧读取角色sprites图
重力重力加速度是根据地球重力加速度做的,公式如下
12vy += 9.8y += vy
碰撞此处碰撞是自己写得函数,方式是判断两个图形是否相交,若相交则有碰撞
剩余需要开发的小鸟经过管道后分数+1,以及分数对应的图片替换功能
游戏链接
无题
title: 仲夏夜之梦date: 202-01-18 11:25:58categories:
迪仔tags:
迪仔
话剧
仲夏夜之梦password: xugudragonabstract: 迪仔宝宝可见,隐藏隐藏message: 只有迪仔宝宝才能看的哟,请输入密码top_img: /img/bg/dizai4.jpgcover: /img/bg/dizai4.jpg
今天和迪仔宝宝一起看了雷曼三兄弟,上周话剧看了仲夏夜之梦,都是在中间剧场看的。
不得不感叹莎翁的笔力以及剧情张力,即使1000年后仍然吸引,仲夏夜之梦的台词并没有改变,和原著本身是一模一样的,只是表现上会更符合现代的审美偏好。
迪仔很贴心的为我准备了晕车药,我为迪仔做了凉面早餐,还准备了小零食。在看话剧的时候,我俩依偎着坐在一起,特别舒服,时不时偷亲一下。
我一直觉得几千年前的人和现代的人其实没什么太大区别,在我读理想国的时候就感觉到了。智慧上,情感上,需求上都和现代人相差无几,只是时代的差别,文化积累,亦或是知识积累的差别。古代人只是不了解一些现代基 ...
实现宝可梦分类以及对宝可梦数据分析
前言李宏毅老师的宝可梦分类挺有意思的,所以我想尝试一下走这方面的分类,因为查看了一下网上并没有源代码,那就自己写试试吧,,数据集来源于kaggle。
分析数据首先我们可以看一下我们的数据
abilities
against_bug
against_dark
against_dragon
against_electric
against_fairy
against_fight
against_fire
against_flying
against_ghost
…
percentage_male
pokedex_number
sp_attack
sp_defense
speed
type1
type2
weight_kg
generation
is_legendary
0
[‘Overgrow’, ‘Chlorophyll’]
1.0
1.0
1.0
0.5
0.5
0.5
2.0
2.0
1.0
…
88.1
1
65
65
45
grass
poison
6.9
1
0
1
[‘Overgrow’, ‘Chlorophyll’]
1.0
1.0
1.0
0.5
0.5 ...
10.Classification
Classification Example
关于分类问题,假设输入是金字图片,那么分类就是这个字属于哪个字。
输入是关于个人金融相关信息,输出就是同意贷款or拒绝贷款
假设输入是医疗诊断,目前的症状,输出就是分类属于哪种疾病
Example Application对于宝可梦的问题,假设我们的input输入是皮卡丘,分类是电,input杰尼龟,输出是水,input是妙蛙种子,输出是草
但是我们如何将pokemon,也就是将这个input数值化呢?pokemon会有七个数值,这七个数值可以组成一个数组。
total就是hp,attack, defense,sp atk, sp df,speed总和的值,将七个数字分入到一个function。
how to do classification将pokemon 编号400以下的数据当训练集,400以上编号的数据当测试集。假设我们分类为二分类问题,取值范围为1,-1,那么得出来结果偏1的就是class1, 结果偏-1的就是class2
假设我们用回归的问题做分类问题,就可能会在训练的时候遇到这样的问题
可以看到右图中出现了一些erro ...