返回顶部
深色模式
您需要 登录 才可以下载或查看,没有帐号?免费注册
使用道具 举报
星空下的牧羊人 发表于 2025-6-1 09:528 F( u' r. \' L4 {2 j _7 N(欢迎访问老王论坛:laowang.vip) 与其搞这个~不如教教我们怎么样用AI写一些自己能用的软件嘞~' ?% X5 a2 q; T$ N+ s( z: }& K(欢迎访问老王论坛:laowang.vip) 授人以鱼不如授人以渔~ ) Z# R c8 M0 R" I: h通俗易懂的话~ ...
有40000+的txt中文小说文本,需要打开系统的文件夹选择框选择文件夹(txt文本分布在多层子文件夹里)进行相似度匹配,每个文本抽取前1500-2000字进行对比,达到60%重复(字面重复率)就把对比的文件名信息和重复率写到总文件夹同级的txt文件中,不足字数的文件跳过,把信息写到另一个txt中,异常写入另一个txt中,python3,GPU加速(希望优先用 GPU,但兼容 CPU ),批量处理,并行计算,重新写能实现的代码,不再使用之前的代码,支持更多的文本编码
Marine233 发表于 2025-6-2 00:17 $ u2 e) d% p( ^, t1 A8 `. dDuplicate Cleaner Pro - ?' Y" ^5 V% Y6 ]8 X这个软件可以去重,我经常拿来对收集的网图去重,它的对比原理是哈希值(我不懂这是 ...
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
此网址随时会失效,推荐截图保存此说明或者存一下地址发布邮箱,以防地址失效!!!
永久主域名:laowang.vip(大陆地区需要翻墙)
地址发布邮箱:[email protected](发送任意内容到此邮箱即可获取最新大陆可访问地址)