使用采集插件保存附件时未知原因采集大量重复图片导致空间不足原创文章

玩技站长 运维笔记评论145字数 856阅读模式

使用采集插件保存附件时未知原因采集大量重复图片导致空间不足

使用场景:

50万张图片:筛选相同目录下,文件名称前多少位数相同,且文件个数超过指定数量,的文件进行筛选,并且记录日志,用于删除重复文件减少空间的占用。文章源自玩技e族-https://www.playezu.com/739241.html

问题案例:

保存附件时,重复保存导致空间急剧减少,需要删除附件保存的文章,可以直接将相关附件删除。文章源自玩技e族-https://www.playezu.com/739241.html

脚本代码:(shell脚本实现)
评论后查看
原创不易此内容为****隐藏内容****评论后,刷新页面即可查看

请将 "/path/to/directory" 替换为您要查询的实际目录路径,并根据需要调整 prefix_lengthmin_count 的值。脚本使用 find 命令获取目录中的文件列表,并使用 awksort 进行处理,以获取满足条件的文件名。最后,将结果输出到名为 result.log 的日志文件中。文章源自玩技e族-https://www.playezu.com/739241.html

运行脚本:

要使用该脚本,将其保存为 .sh 文件(例如 query_files.sh),然后在终端中运行以下命令来执行脚本:文章源自玩技e族-https://www.playezu.com/739241.html

bash query_files.sh

脚本会在当前目录下生成 result.log 文件,并将查询结果保存其中。文章源自玩技e族-https://www.playezu.com/739241.html

请注意,该脚本仅查找指定目录下的文件,不会递归到子目录。如果您需要递归查询,请将 find 命令的参数 -type f 修改为 -type f -name "*".文章源自玩技e族-https://www.playezu.com/739241.html 文章源自玩技e族-https://www.playezu.com/739241.html

玩技站长微信
添加好友自动发送入群邀请
weinxin
rainbow-shownow
玩技官方公众号
官方微信公众号
weinxin
PLAYEZU
 最后更新:2023-6-25
  • 版权提示:本站仅供存储任何法律责任由作者承担▷诈骗举报◁▷新闻不符◁▷我要投稿◁
    风险通知:非原创文章均为网络投稿真实性无法判断,侵权联系2523030730
    免责声明:内容来自用户上传发布或新闻客户端自媒体,切勿!切勿!切勿!添加联系方式以免受骗。
  • 原创转载:https://www.playezu.com/739241.html
    转载说明: 点我前往阅读>>>
匿名

发表评论

匿名网友
确定