injustice 在 求推荐本地的pdf转md方案 中发帖
用爬虫抓了1w篇paper,需要转md/txt便于LLM读取。需要本地是因为想并发处理,MinerU效果很好但是不能批量薅
不是扫描版,不需要ocr。然而即使放低标准还是找不到理想的项目 😭
试了几个python库,连换行和换页都处理不好,更别提排版问题了
详情链接:
https://linux.do/t/topic/1340665/1
来源: LINUX DO, 消息ID: 262898
injustice 在 求推荐本地的pdf转md方案 中发帖
用爬虫抓了1w篇paper,需要转md/txt便于LLM读取。需要本地是因为想并发处理,MinerU效果很好但是不能批量薅
不是扫描版,不需要ocr。然而即使放低标准还是找不到理想的项目 😭
试了几个python库,连换行和换页都处理不好,更别提排版问题了
详情链接:
https://linux.do/t/topic/1340665/1
来源: LINUX DO, 消息ID: 262898
@fyk 在 那些ai改编的歌都是咋弄的,好听的要命啊!!!! 中发帖
老是刷到各种ai老歌改编的r&b版本,真的好好听好好听
yxvm 在 各位佬,notebooklm 里面可以设置系统指令嘛,解决 mermiad 语法错误 中发帖
1、现在经常遇到输出结果中包含 mermiad 图,有时候会有语法错误,想通过指令的…
DSUK 在 优化的书签程序 中发帖
一个用了两年的书签同步,经历了n次有惊无险的误操作
终于还是fork写了一下
虽然鸽了两年,但还是感谢dudor大佬🙏
压缩包在release里
…
@Byron 在 【终极指南】Mac 下 Antigravity 登录后模型加载不出的“断命”级解决方案 中发帖
相信很多朋友和我一样,好不容易按照网上的教程配置了 Proxifier,结果发…