【转载】Linux下删除大量文件效率对比

inux下面删除大量文件的效率。

首先建立50万个文件

$ test   for i in $(seq 1 500000);do echo text >>$i.txt;done

1.   rm删除

 time rm -f * 

由于文件数量过多,rm不起作用。

2.  find删除

 $ time find ./ -type f -exec rm {} \; 
 find ./ -type f -delete  0.43s user 11.21s system 2% cpu 9:13.38 total 

大概43分钟

3.  find with delete

$ time find ./ -type f -delete
 find ./ -type f -delete  0.43s user 11.21s system 2% cpu 9:13.38 total 

用时9分钟。

4.  rsync删除

# 首先建立空文件夹blanktest 
$ time rsync -a --delete blanktest/ test/
 rsync -a --delete blanktest/ test/
0.59s user 7.86s system 51% cpu 16.418 total 16s
16s,很好很强大。

5.  Python删除

import os
import timeit
def main():
    for pathname,dirnames,filenames in os.walk('/home/username/test'):
        for filename in filenames:
            file=os.path.join(pathname,filename)
            os.remove(file)
            
if __name__=='__main__':
t=timeit.Timer('main()','from __main__ import main')
print t.timeit(1)  
1
2
$ python test.py
529.309022903
大概用时9分钟。

6.  Perl删除

$ time perl -e 'for(<*>){((stat)[9]<(unlink))}'
perl -e 'for(<*>){((stat)[9]<(unlink))}'  1.28s user 7.23s system 50% cpu 16.784 total
16s,这个应该最快了。

7、结果:

rm:文件数量太多,不可用
find with -exec 50万文件耗时43分钟
find with -delete 9分钟
Perl  16s
Python 9分钟
rsync with -delete  16s

结论:删除大量小文件rsync最快,最方便。

发表评论

电子邮件地址不会被公开。 必填项已用*标注