目錄
字符串是一種非常重要的數(shù)據(jù)類型,但是C語言不存在顯式的字符串類型,C語言中的字符串都以字符串常量的形式出現(xiàn)或存儲(chǔ)在字符數(shù)組中。同時(shí),C 語言提供了一系列庫函數(shù)來對(duì)操作字符串,這些庫函數(shù)都包含在頭文件 string.h 中。
一、字符串常量和字符數(shù)組1.1、什么是字符串常量
C 語言雖然沒有字符串類型,但是 C語言提是存在字符串這個(gè)概念的,也就是字符串常量:以 NUL 字節(jié)結(jié)尾的 0 個(gè)或多個(gè)字符組成的序列。字符串常量是不可被修改的,一般用一對(duì)雙引號(hào)(" ")括起的一串字符來表示字符串常量,如:
"Hello!"、"\aWarning!\a"、"123abc\n"、""
字符串常量可以為空,如""就是一個(gè)空的字符串常量,但是即使為空,還是存在一個(gè)終止符 NUL 的。(在 C 語言中,常用轉(zhuǎn)義字符 \0 來表示 NUL)
1.2、字符串常量與指針
字符串常量與指針關(guān)系密切,因?yàn)樽址A康闹?,?shí)際上表示的是存儲(chǔ)這些字符的內(nèi)存空間的地址,更準(zhǔn)確地說是字符串常量中第 1 個(gè)字符的地址,而不是這些字符本身。因此,在 C 語言中是不能直接進(jìn)行字符串賦值的(因?yàn)闆]有字符串類型嘛)。在 C 語言中,常通過聲明一個(gè)指向 char 類型的指針并將其初始化為一個(gè)字符串常量的方式來訪問一個(gè)字符串:
char *message = "Hello World!";// 上面的語句也可以拆分成下面兩句char *message; message = "Hello World!"; // 這句話看起來像是字符串復(fù)制,其實(shí)不是,只是涉及到指針操作
上述語句聲明了一個(gè)指向 char 類型的指針,并用字符串常量中第 1 個(gè)字符的地址對(duì)該指針進(jìn)行初始化??梢酝ㄟ^字符指針 message 來訪問字符串常量:
#include <stdio.h>int main() { char *message = "Hello World!"; printf("%s\n",message); while(*message != '\0'){ printf("%c ",*message++); } printf("\n"); return 0; }/* output: * Hello World! * H e l l o W o r l d ! */
這段代碼,使用字符指針遍歷了字符串常量中的每一個(gè)字符。
1.3、字符數(shù)組
用于存放字符的數(shù)組稱為字符數(shù)組。在 C 語言中,除了字符串常量外,其他所有字符串都必須存儲(chǔ)于字符數(shù)組或動(dòng)態(tài)分配的內(nèi)存中。定義一個(gè)字符數(shù)組和定義一個(gè)普通數(shù)組一樣,不同的是字符數(shù)組中存放的是字符數(shù)據(jù)而已:
char charArray[] = {'H','e','l','l','o'}; // 聲明并初始化一個(gè)字符數(shù)組
這句話定義并初始化了一個(gè)字符數(shù)組 charArray。這個(gè)數(shù)組的長度實(shí)際上為 6 ,因?yàn)闀?huì)自動(dòng)添加一個(gè)字符串結(jié)束符 '\0'。
C 語言提供了一種更簡潔的方法來對(duì)字符數(shù)組進(jìn)行初始化:
char charArray[] = "Hello World!"; // 聲明并初始化一個(gè)字符數(shù)組
上述兩種聲明方式等價(jià)。
可以對(duì)一個(gè)字符數(shù)組做出修改:
#include <stdio.h>#include <string.h>int main() { char str[] = "hello world!"; int len = strlen(str); int i; for(i = 0; i < len; i++){ if( str[i] <= 'z' && str[i] >= 'a'){ str[i] = str[i] - 32; } } printf("%s\n",str); }
這段代碼可以將字符數(shù)組中的小寫字母轉(zhuǎn)換成大寫字母后輸出。
1.4、 字符串常量與字符數(shù)組的區(qū)別
1)字符串常量是一個(gè)字符數(shù)組,但是內(nèi)容和長度在初始化時(shí)就已經(jīng)固定了,不可更改;可以通過一個(gè)指向字符串常量第一個(gè)元素的指針來訪問該字符串常量;
2)字符數(shù)組是一個(gè)用于存放字符的數(shù)組,字符數(shù)組的值是可以更改的。
二、獲取字符串長度
字符串的長度就是這個(gè)字符串所包含字符的個(gè)數(shù),但是這個(gè)長度是不包含 NUL 字符的。C 語言中使用庫函數(shù) strlen 來計(jì)算字符串長度:
size_t strlen(char const *string);
需要注意的是 strlen 的返回值類型:size_t 類型,這是一個(gè)無符號(hào)整數(shù)類型。
#include <stdio.h>#include <stdlib.h>#include <string.h>int main() { char str1[] = "Hello World!"; printf("%d\n",strlen(str1)); return 0; }/* output: * 12 */
三、復(fù)制字符串
C 語言中使用庫函數(shù) strcpy 來進(jìn)行字符串復(fù)制操作:
char *strcpy(char *dst , char const *src);
函數(shù) strcpy 接收兩個(gè)字符串參數(shù),并將參數(shù) src 字符串復(fù)制到 dst 參數(shù)。使用 strcpy 函數(shù)時(shí)需要注意的是,必須保證目標(biāo)字符數(shù)組 dst 的長度足夠存放源字符數(shù)組 src 的內(nèi)容。如果 src 比 dst 長,則 src 剩余部分的字符仍會(huì)被復(fù)制,而且它們會(huì)覆蓋 dst 后面的內(nèi)存空間的值,如果這除內(nèi)存空間原本就存放有值,則會(huì)導(dǎo)致原本的數(shù)據(jù)丟失,這樣會(huì)造成很嚴(yán)重的后果。為了解決這個(gè)問題, C 語言中提供了一種更為安全的方式來進(jìn)行字符串復(fù)制操作——strncpy 函數(shù):
char *strncpy(char *dst , char const *src , size_t len);
strncpy 函數(shù)有三個(gè)參數(shù),與 strcpy 函數(shù)一樣,它也是將 src 字符串中的字符復(fù)制到目標(biāo)數(shù)組 dst 中去,但是 strncpy 函數(shù)提供的第三個(gè)參數(shù) len 規(guī)定了可以向 dst 中寫入的字符的個(gè)數(shù):
1)如果 strlen(src) > len,則只有 len 個(gè)字符被復(fù)制到 dst 中去,此時(shí) dst 將不會(huì)以 NUL 字節(jié)結(jié)尾(也就是說,strncpy 調(diào)用的結(jié)果可能不是一個(gè)字符串);
2)如果 strlen(src) < len,則 src 中的字符全被復(fù)制到 dst 中去,dst 中剩余的部分用 NUL 填充。
四、連接字符串
C 語言中使用庫函數(shù) strcat 來連接兩個(gè)字符串:
char *strcat(char *dst,char const *src);
函數(shù) strcat 將參數(shù) src 字符串連接到參數(shù) dst 字符串的后面。與 strcpy 函數(shù)一個(gè)同樣的問題是,必須保證 dst 的剩余空間足夠存放下 src 整個(gè)字符串。C 語言中提供了 strncat 函數(shù)來解決這個(gè)問題:
char *strncat(char *dst , char const *src , size_t len);
strncat 函數(shù)從 src 中最多復(fù)制 len 個(gè)字符到目標(biāo)數(shù)組 dst 后面,并且,strncat 總是在結(jié)果字符串后面添加一個(gè) NUL 字節(jié),而且不會(huì)像 strncpy 函數(shù)那樣對(duì) dst 剩余的空間用 NUL 進(jìn)行填充。
五、字符串比較
C 語言中使用庫函數(shù) strcmp 來進(jìn)行字符串比較。strcmp 函數(shù)會(huì)對(duì)被比較的兩個(gè)字符串進(jìn)行逐字符地比較,直到發(fā)現(xiàn)不匹配為止:最先不匹配的字符中較小的那個(gè)字符所對(duì)應(yīng)的字符串即被認(rèn)為小于另一個(gè)字符串;如果兩者所有字符都匹配,則認(rèn)為這兩個(gè)字符串相等;
int strcmp(char const *s1 , char sonst *s2);
該函數(shù)的返回值如下:
1)s1 小于 s2,返回一個(gè)負(fù)值;
2)s1 等于 s2,返回 0;
3)s1 大于 s2,返回一個(gè)正值。
char *strncmp(char const *s1 , char const *s2 , size_t len);
可以使用 strncmp 函數(shù)限定比較的字符的個(gè)數(shù),返回值與 strcmp 一樣,但是只針對(duì)前 len 個(gè)字符進(jìn)行比較。
六、字符串的查找6.1 查找一個(gè)字符
可以使用 strchr 函數(shù)或 strrchr 函數(shù)來在一個(gè)字符串中查找一個(gè)特定的字符:
char *strchr(char const *str,int ch); // int ch 是字符的ASCII碼值char *strrchr(char const *str,int ch);
函數(shù) strchr 在字符串 str 中查找字符 ch 第一次出現(xiàn)的位置,并返回一個(gè)指向該位置的指針;如果沒有找到相應(yīng)的字符,則返回一個(gè) NULL 指針。函數(shù) strrchr 在字符串中查找字符 ch 最后一次出現(xiàn)的位置,并返回指向該位置的指針。
6.2 查找任意幾個(gè)字符
可以使用 strpbrk 函數(shù)來查找任何一組字符第一次在字符串中出現(xiàn)的位置:
char *strpbrk(char const *str , char const *group);
這個(gè)函數(shù)返回一個(gè)指向字符串 str 中第一個(gè)匹配 group 中任何一個(gè)字符的字符位置,如果沒有匹配到,則返回一個(gè) NULL 指針。
6.3 查找一個(gè)子串
可以使用 strstr 函數(shù)來在一個(gè)字符串中查找一個(gè)子串:
char *strstr(char const *str1 , char const *str2);
這個(gè)函數(shù)在 str1 中查找整個(gè)字符串 str2 第一次出現(xiàn)的起始位置,并返回一個(gè)指向該位置的指針;如果 str2 并沒有完整的出現(xiàn)在 str1 中,則函數(shù)將返回一個(gè) NULL 指針;如果 str2 是一個(gè)空字符串,則返回str1.
參考資料
《C和指針》
《C程序設(shè)計(jì)語言 第二版》