人工输入的数据有没有办法变成excel可编辑电子版

@Ta 08-23 10:24 32140点击
现在有几万个纸档数据,有没有办法通过扫描或者其他方法变成可编辑的excel电子档?工具有手机拍照或扫描仪,可以导出pdf,各种图像格式

已经测试过的软件或方法:
1、扫描全能王VIP,这个成功率最好,但有很多错误的,需要一个一个核对,数据量太多没有意义。
2、布丁扫描,识别率比较差,没多少能成功的。
3、QQ截图识别,哔哩哔哩上推荐的,效果也不尽如意。
4、常见的几个在线pdf转excel网站,基本得到的就是一张扫描照片或空白excel。
5、福昕pdf编辑器,转换成excel里面加图片。
6、Power Bi,网上说可以转成pdf识别,我试了直接空白。

还有没有其他方法?附件大家可以试一下
尺寸数据.pdf(66.88 KB)
回复列表(29|隐藏机器人聊天)
  • @Ta / 08-23 11:46 / /
    要想数据准确,恐怕只能花钱外包真“人工”智能。识别的100%需要校对
  • @Ta / 08-23 11:47 / /

    @hui214,这个有帮助吗:PaddleOCR

    看起来能识别很多形式的东西。。
    out.webp(144.53 KB)

  • @Ta / 08-23 12:01 / /
    @无名啊,这个没试过
  • @Ta / 08-23 12:21 / /

    WPS AI 识别不到手写数据
    wechat_2024-08-23_122114_629.png(586.17 KB)

  • @Ta / 08-23 12:52 / /
    @无名啊,这个使用起来也比较麻烦
  • @Ta / 08-23 12:53 / /
    @老虎会游泳,这个图片亮度可以用布丁扫描处理一下的
  • @Ta / 08-23 13:23 / /

    @hui214,亮起的地方是识别到文字了,暗的地方是没识别到。截图说明大部分手写数据都没识别到。

  • @Ta / 08-23 13:26 / /
    @hui214,你自己用Python训练一个AI就行了
  • @Ta / 08-23 14:05 / /
    主要是拍照导出的 PDF,本质内容就是一张图片,只能走 OCR 提取,市面上的 PDF 转 Excel,大部分都是要 PDF 含有文字内容的才能识别到,逻辑是通过解析 PDF 内容去提取,就像 Word 里面放表格跟放表格图片的区别一样,放了表格的就能读到,放了图片肯定读不出来。

    尝试下百度的 OCR 或者看看 AI 能不能处理,理论上这俩能识别,但是还需要人工校对一遍(校对可以骚操作,两截图 diff 一下,业界有图片比对的软件)。

    基本上这样能保证大部分数据可用了,但是 100% 可用就不能保证了。
  • @Ta / 08-23 22:52 / /
    @李沐沐,没搞过,不知道怎么训练,有没有教程?
    @无名啊,安装以后有些下载很慢或下载错误,就没办法使用了,吾爱破解上面的也找了几个,都没什么效果
    @hello_新,能识别80%以上手工核对都无所谓,基本识别都差异比较大,没几个成功的。
  • @Ta / 08-24 12:16 / /
    使用Rapid🗲OCR Demo也不行,截取一小部分也一样
    12.png(513.44 KB)
  • hik
    @Ta / 08-24 13:41 / /

    手写的不行

  • @Ta / 08-24 14:58 / /
    用百度的https://ai.baidu.com/tech/ocr_others/handwriting ,但是你要的功能很难实现,json还有进行转换,python可以实现识别、转换,但是不能保证手写识别准确率的。
  • @Ta / 08-24 18:48 / /
    @森森,这个效果看起来更好,但数据有很多错误的,数值也不好匹配。image.png(1.1 MB)
  • @Ta / 08-25 02:29 / /
    找一个大学生
  • @Ta / 08-25 08:07 / /
    被锁定
    层主 @滑稽山脉 于 2024-09-30 20:15 删除了该楼层。
  • @Ta / 08-25 20:02 / /
    @tasy5kg,我们这里招了3个大学生
  • @Ta / 08-27 14:54 / /
    我记得有专业数据扫描上传的机器,我在电网看见过!很快准确率很高!
  • @Ta / 08-27 14:56 / /
    在档案室我也见过,专业做数字化保存那个扫描机,不知道叫啥!
添加新回复
回复需要登录