5.13 獲取文件夾中的文件列表

2018-02-24 15:26 更新

問題

你想獲取文件系統(tǒng)中某個目錄下的所有文件列表。

解決方案

使用 os.listdir() 函數(shù)來獲取某個目錄中的文件列表:

import os
names = os.listdir('somedir')

結(jié)果會返回目錄中所有文件列表,包括所有文件,子目錄,符號鏈接等等。如果你需要通過某種方式過濾數(shù)據(jù),可以考慮結(jié)合 os.path 庫中的一些函數(shù)來使用列表推導(dǎo)。比如:

import os.path

# Get all regular files
names = [name for name in os.listdir('somedir')
        if os.path.isfile(os.path.join('somedir', name))]

# Get all dirs
dirnames = [name for name in os.listdir('somedir')
        if os.path.isdir(os.path.join('somedir', name))]

字符串的 startswith()endswith() 方法對于過濾一個目錄的內(nèi)容也是很有用的。比如:

pyfiles = [name for name in os.listdir('somedir')
            if name.endswith('.py')]

對于文件名的匹配,你可能會考慮使用 globfnmatch 模塊。比如:

import glob
pyfiles = glob.glob('somedir/*.py')

from fnmatch import fnmatch
pyfiles = [name for name in os.listdir('somedir')
            if fnmatch(name, '*.py')]

討論

獲取目錄中的列表是很容易的,但是其返回結(jié)果只是目錄中實體名列表而已。如果你還想獲取其他的元信息,比如文件大小,修改時間等等,你或許還需要使用到 os.path 模塊中的函數(shù)或著 os.stat() 函數(shù)來收集數(shù)據(jù)。比如:

# Example of getting a directory listing

import os
import os.path
import glob

pyfiles = glob.glob('*.py')

# Get file sizes and modification dates
name_sz_date = [(name, os.path.getsize(name), os.path.getmtime(name))
                for name in pyfiles]
for name, size, mtime in name_sz_date:
    print(name, size, mtime)

# Alternative: Get file metadata
file_metadata = [(name, os.stat(name)) for name in pyfiles]
for name, meta in file_metadata:
    print(name, meta.st_size, meta.st_mtime)

最后還有一點要注意的就是,有時候在處理文件名編碼問題時候可能會出現(xiàn)一些問題。通常來講,函數(shù) os.listdir() 返回的實體列表會根據(jù)系統(tǒng)默認的文件名編碼來解碼。但是有時候也會碰到一些不能正常解碼的文件名。關(guān)于文件名的處理問題,在5.14和5.15小節(jié)有更詳細的講解。

以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號