W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
你需要將一個字符串分割為多個字段,但是分隔符(還有周圍的空格)并不是固定的。
string對象的 split()
方法只適應(yīng)于非常簡單的字符串分割情形,它并不允許有多個分隔符或者是分隔符周圍不確定的空格。當(dāng)你需要更加靈活的切割字符串的時候,最好使用 re.split()
方法:
>>> line = 'asdf fjdk; afed, fjek,asdf, foo'
>>> import re
>>> re.split(r'[;,\s]\s*', line)
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
函數(shù) re.split()
是非常實用的,因為它允許你為分隔符指定多個正則模式。比如,在上面的例子中,分隔符可以是逗號(,),分號(;)或者是空格,并且后面緊跟著任意個的空格。只要這個模式被找到,那么匹配的分隔符兩邊的實體都會被當(dāng)成是結(jié)果中的元素返回。返回結(jié)果為一個字段列表,這個跟 str.split()
返回值類型是一樣的。
當(dāng)你使用 re.split()
函數(shù)時候,需要特別注意的是正則表達式中是否包含一個括號捕獲分組。如果使用了捕獲分組,那么被匹配的文本也將出現(xiàn)在結(jié)果列表中。比如,觀察一下這段代碼運行后的結(jié)果:
>>> fields = re.split(r'(;|,|\s)\s*', line)
>>> fields
['asdf', ' ', 'fjdk', ';', 'afed', ',', 'fjek', ',', 'asdf', ',', 'foo']
>>>
獲取分割字符在某些情況下也是有用的。比如,你可能想保留分割字符串,用來在后面重新構(gòu)造一個新的輸出字符串:
>>> values = fields[::2]
>>> delimiters = fields[1::2] + ['']
>>> values
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
>>> delimiters
[' ', ';', ',', ',', ',', '']
>>> # Reform the line using the same delimiters
>>> ''.join(v+d for v,d in zip(values, delimiters))
'asdf fjdk;afed,fjek,asdf,foo'
>>>
如果你不想保留分割字符串到結(jié)果列表中去,但仍然需要使用到括號來分組正則表達式的話,確保你的分組是非捕獲分組,形如(?:...)。比如:
>>> re.split(r'(?:,|;|\s)\s*', line)
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
>>>
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: