閱讀(30.7k) 書簽贊(2) 我要糾錯

字符串(4)

2021-09-09 15:31 更新

字符串的內(nèi)容的確不少，甚至都有點啰嗦了。但是，本節(jié)依然還要繼續(xù)，就是因為在編程實踐中，經(jīng)常會遇到有關(guān)字符串的問題，而且也是很多初學者容易迷茫的。

字符串格式化輸出

什么是格式化？在維基百科中有專門的詞條，這么說的：

格式化是指對磁盤或磁盤中的分區(qū)（partition）進行初始化的一種操作，這種操作通常會導致現(xiàn)有的磁盤或分區(qū)中所有的文件被清除。

不知道你是否知道這種“格式化”。顯然，此格式化非我們這里所說的，我們說的是字符串的格式化，或者說成“格式化字符串”，都可以，表示的意思就是：

格式化字符串，是C、C++等程序設計語言printf類函數(shù)中用于指定輸出參數(shù)的格式與相對位置的字符串參數(shù)。其中的轉(zhuǎn)換說明（conversion specification）用于把隨后對應的0個或多個函數(shù)參數(shù)轉(zhuǎn)換為相應的格式輸出；格式化字符串中轉(zhuǎn)換說明以外的其它字符原樣輸出。

這也是來自維基百科的定義。在這個定義中，是用C語言作為例子，并且用了其輸出函數(shù)來說明。在python中，也有同樣的操作和類似的函數(shù)print，此前我們已經(jīng)了解一二了。

如果將那個定義說的通俗一些，字符串格式化化，就是要先制定一個模板，在這個模板中某個或者某幾個地方留出空位來，然后在那些空位填上字符串。那么，那些空位，需要用一個符號來表示，這個符號通常被叫做占位符（僅僅是占據(jù)著那個位置，并不是輸出的內(nèi)容）。

>>> "I like %s"
'I like %s'

在這個字符串中，有一個符號：%s，就是一個占位符，這個占位符可以被其它的字符串代替。比如：

>>> "I like %s" % "python"
'I like python'
>>> "I like %s" % "Pascal"
'I like Pascal'

這是較為常用的一種字符串輸出方式。

另外，不同的占位符，會表示那個位置應該被不同類型的對象填充。下面列出許多，供參考。不過，不用記憶，常用的只有%s和%d，或者再加上%f，其它的如果需要了，到這里來查即可。

占位符	說明
%s	字符串(采用str()的顯示)
%r	字符串(采用repr()的顯示)
%c	單個字符
%b	二進制整數(shù)
%d	十進制整數(shù)
%i	十進制整數(shù)
%o	八進制整數(shù)
%x	十六進制整數(shù)
%e	指數(shù) (基底寫為e)
%E	指數(shù) (基底寫為E)
%f	浮點數(shù)
%F	浮點數(shù)，與上相同
%g	指數(shù)(e)?或浮點數(shù) (根據(jù)顯示長度)
%G	指數(shù)(E)或浮點數(shù) (根據(jù)顯示長度)

看例子：

>>> a = "%d years" % 15
>>> print a
15 years

當然，還可以在一個字符串中設置多個占位符，就像下面一樣

>>> print "Suzhou is more than %d years. %s lives in here." % (2500, "qiwsir")
Suzhou is more than 2500 years. qiwsir lives in here.

對于浮點數(shù)字的打印輸出，還可以限定輸出的小數(shù)位數(shù)和其它樣式。

>>> print "Today's temperature is %.2f" % 12.235
Today's temperature is 12.23
>>> print "Today's temperature is %+.2f" % 12.235
Today's temperature is +12.23

注意，上面的例子中，沒有實現(xiàn)四舍五入的操作。只是截取。

關(guān)于類似的操作，還有很多變化，比如輸出格式要寬度是多少等等。如果看官在編程中遇到了，可以到網(wǎng)上查找。我這里給一個參考圖示，也是從網(wǎng)上抄來的。

其實，上面這種格式化方法，常常被認為是太“古老”了。因為在python中還有新的格式化方法。

>>> s1 = "I like {}".format("python")
>>> s1
'I like python'
>>> s2 = "Suzhou is more than {} years. {} lives in here.".format(2500, "qiwsir") 
>>> s2
'Suzhou is more than 2500 years. qiwsir lives in here.'

這就是python非常提倡的string.format()的格式化方法，其中{}作為占位符。

這種方法真的是非常好，而且非常簡單，只需要將對應的東西，按照順序在format后面的括號中排列好，分別對應占位符{}即可。我喜歡的方法。

如果你覺得還不明確，還可以這樣來做。

>>> print "Suzhou is more than {year} years. {name} lives in here.".format(year=2500, name="qiwsir") 
Suzhou is more than 2500 years. qiwsir lives in here.

真的很簡潔，看成優(yōu)雅。

其實，還有一種格式化的方法，被稱為“字典格式化”，這里僅僅列一個例子，如果看官要了解字典的含義，本教程后續(xù)會有的。

>>> lang = "python"
>>> print "I love %(program)s"%{"program":lang}
I love python

列舉了三種基本格式化的方法，你喜歡那種？我推薦：string.format()

常用的字符串方法

字符串的方法很多?？梢酝ㄟ^dir來查看：

>>> dir(str)
['__add__', '__class__', '__contains__', '__delattr__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__getslice__', '__gt__', '__hash__', '__init__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_formatter_field_name_split', '_formatter_parser', 'capitalize', 'center', 'count', 'decode', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'index', 'isalnum', 'isalpha', 'isdigit', 'islower', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']

這么多，不會一一介紹，要了解某個具體的含義和使用方法，最好是使用help查看。舉例：

>>> help(str.isalpha)

Help on method_descriptor:

isalpha(...)
    S.isalpha() -> bool

    Return True if all characters in S are alphabetic
    and there is at least one character in S, False otherwise.

按照這里的說明，就可以在交互模式下進行實驗。

>>> "python".isalpha()    #字符串全是字母，應該返回True
True
>>> "2python".isalpha()    #字符串含非字母，返回False
False

split

這個函數(shù)的作用是將字符串根據(jù)某個分割符進行分割。

>>> a = "I LOVE PYTHON"
>>> a.split(" ")
['I', 'LOVE', 'PYTHON']

這是用空格作為分割，得到了一個名字叫做列表（list）的返回值，關(guān)于列表的內(nèi)容，后續(xù)會介紹。還能用別的分隔嗎？

>>> b = "www.itdiffer.com"
>>> b.split(".")
['www', 'itdiffer', 'com']

去掉字符串兩頭的空格

這個功能，在讓用戶輸入一些信息的時候非常有用。有的朋友喜歡輸入結(jié)束的時候敲擊空格，比如讓他輸入自己的名字，輸完了，他來個空格。有的則喜歡先加一個空格，總做的輸入的第一個字前面應該空兩個格。

這些空格是沒用的。python考慮到有不少人可能有這個習慣，因此就幫助程序員把這些空格去掉。

方法是：

S.strip() 去掉字符串的左右空格
S.lstrip() 去掉字符串的左邊空格
S.rstrip() 去掉字符串的右邊空格

例如：

>>> b=" hello "    #兩邊有空格
>>> b.strip()
'hello'
>>> b
' hello '

特別注意，原來的值沒有變化，而是新返回了一個結(jié)果。

>>> b.lstrip()    #去掉左邊的空格
'hello '
>>> b.rstrip()    #去掉右邊的空格
' hello'

字符大小寫的轉(zhuǎn)換

對于英文，有時候要用到大小寫轉(zhuǎn)換。最有名駝峰命名，里面就有一些大寫和小寫的參合。如果有興趣，可以來這里看自動將字符串轉(zhuǎn)化為駝峰命名形式的方法。

在python中有下面一堆內(nèi)建函數(shù)，用來實現(xiàn)各種類型的大小寫轉(zhuǎn)化

S.upper() #S中的字母大寫
S.lower() #S中的字母小寫
S.capitalize() #首字母大寫
S.isupper() #S中的字母是否全是大寫
S.islower() #S中的字母是否全是小寫
S.istitle()

看例子：

>>> a = "qiwsir,python" 
>>> a.upper()       #將小寫字母完全變成大寫字母
'QIWSIR,PYTHON'
>>> a               #原數(shù)據(jù)對象并沒有改變
'qiwsir,python'
>>> b = a.upper()
>>> b
'QIWSIR,PYTHON'
>>> c = b.lower()   #將所有的大寫字母變成小寫字母
>>> c
'qiwsir,python'

>>> a
'qiwsir,python'
>>> a.capitalize()  #把字符串的第一個字母變成大寫
'Qiwsir,python'
>>> a               #原數(shù)據(jù)對象沒有改變
'qiwsir,python'
>>> b = a.capitalize() #新建立了一個
>>> b
'Qiwsir,python'

>>> a = "qiwsir,github"    #這里的問題就是網(wǎng)友白羽毛指出的，非常感謝他。
>>> a.istitle()
False
>>> a = "QIWSIR"        #當全是大寫的時候，返回False
>>> a.istitle()
False
>>> a = "qIWSIR"
>>> a.istitle()
False
>>> a = "Qiwsir,github"  #如果這樣，也返回False
>>> a.istitle()
False
>>> a = "Qiwsir"        #這樣是True
>>> a.istitle()
True
>>> a = 'Qiwsir,Github' #這樣也是True
>>> a.istitle()
True

>>> a = "Qiwsir"
>>> a.isupper()
False
>>> a.upper().isupper()
True
>>> a.islower()
False
>>> a.lower().islower()
True

順著白羽毛網(wǎng)友指出的，再探究一下，可以這么做：

>>> a = "This is a Book"
>>> a.istitle()
False
>>> b = a.title()     #這樣就把所有單詞的第一個字母轉(zhuǎn)化為大寫
>>> b
'This Is A Book'
>>> b.istitle()       #判斷每個單詞的第一個字母是否為大寫
True

join拼接字符串

用“+”能夠拼接字符串，但不是什么情況下都能夠如愿的。比如，將列表（關(guān)于列表，后續(xù)詳細說，它是另外一種類型）中的每個字符（串）元素拼接成一個字符串，并且用某個符號連接，如果用“+”，就比較麻煩了（是能夠?qū)崿F(xiàn)的，麻煩）。

用字符串的join就比較容易實現(xiàn)。

>>> b
'www.itdiffer.com'
>>> c = b.split(".")
>>> c
['www', 'itdiffer', 'com']
>>> ".".join(c)
'www.itdiffer.com'
>>> "*".join(c)
'www*itdiffer*com'

這種拼接，是不是簡單呢？

以上內(nèi)容是否對您有幫助：

← 字符串(3)

字符編碼 →

寫筆記

我要補充

字符串(4)

字符串格式化輸出

常用的字符串方法

split

去掉字符串兩頭的空格

字符大小寫的轉(zhuǎn)換

join拼接字符串

推薦文章

推薦教程

推薦課程