前言
在我们编写C程序时,除了使用自定义函数,往往还会使用一些库函数,例如标准输入输出函数printf,scanf,字符串函数strlen,内存函数memset等等,使用这些系统自带的库函数可以轻松地帮我们实现预期的功能,大大提升我们编程的效率。
1.本期我们将介绍库里面一些常见的 字符串函数以及 内存函数。
2.本期的目标时在学会使用这些库函数的同时了解其内部原理,并学会 模拟实现 相应的函数。
温馨提示:可以使用目录跳转到对应函数
2. 字符串函数
C语言中对字符和字符串的处理很是频繁,但是 C语言本身是没有字符串类型的,字符串通常放在
常量字符串或者 字符数组中。
字符串常量适用于那些对它不做修改的字符串函数.
与字符串有关的函数放在 string.h头文件中,使用前要包含对应头文件。
2.1 strlen
2.1.1 基本使用
strlen想必我们都已经很熟悉了,作用是统计字符串的长度,函数原型及说明如下:
字符串以’\0’作为结束标志,strlen返回的是字符串在’\0’前面出现字符的个数(不包含’\0′)
参数指向的字符串必须以’\0’结束,否则最后的值为随机值
strlen的返回值是size_t类型,是无符号整形,这也是最容易忽略的地方。
我们可以这样使用它:
#includeint main(){ char arr1[] = "hello world"; printf("%d", strlen(arr1));//求arr1数组中字符串的长度}
程序输出11,说明其不会统计’\0′,遇到’\0’结束统计:
2.1.2 模拟实现
法一:创建一个临时变量作为计数器
#include#includeint my_strlen(const char* str){ assert(str);//保证传入的指针不为空 int count = 0;//计数器 while (*str++ != '\0')//统计字符,不统计'\0' { count++; } return count;}int main(){ char arr1[] = "hello world"; printf("%d", my_strlen(arr1));}
法二:使用递归的方式
#include#includeint my_strlen(const char* str){ assert(str);//保证传入的指针不为空 if (*str == '\0')//递归终点 { return 0; } else { return 1 + my_strlen(str+1); }}int main(){ char arr1[] = "hello world"; printf("%d", my_strlen(arr1));}
法三: 采用指针-指针的方式,两个指针相减得到的结果即为中间的元素个数。
#include#includeint my_strlen(const char* str){ assert(str);//保证传入的指针不为空 const char* p = str; //将p指向字符串末尾的'\0' while (*++p) { ; } return p - str;//差值即为元素个数}int main(){ char arr1[] = "hello world"; printf("%d", my_strlen(arr1));}
三种方法运行结果都如下:
2.2 strcpy
2.2.1 基本使用
顾名思义,strcpy的作用就是拷贝字符串,它的函数原型及说明如下:
源字符串必须以 ‘\0’ 结束。
对源字符串加上const修饰避免被意外修改
函数会将源字符串中的 ‘\0’ 拷贝到目标空间。
目标空间必须足够大,以确保能存放源字符串,这是程序员所需要注意的。
目标空间必须可变
因此我们可以这样使用它:
#include#includeint main(){ char arr1[] = "hello world"; char arr2[20] = { 0 }; printf("%s", strcpy(arr2, arr1));//由于返回的是拷贝后数组的首元素地址,因此可以进行随机访问}
2.2.2 模拟实现
我们可以通过指针将每个字符逐一拷贝到目标数组 (‘\0’也要拷贝),代码即效果如下:
#include#includechar* my_strcpy(char* dest, const char* src){ assert(dest && src); //断言,保证代码健壮性 char* ret = dest; //保存起始地址,用于返回 //将src的字符逐个拷贝到dest中,包括'\0' while (*dest++ = *src++) { ; } return ret;}int main(){ char arr1[] = "hello world"; char arr2[20] = { 0 }; printf("%s", my_strcpy(arr2, arr1)); //返回拷贝后的数组,支持链式访问}
2.3 strcat
2.3.1 基本使用
strcat的作用是追加字符串,将一个字符串追加到令一个字符串的末尾,函数原型及说明如下:
源字符串必须以 ‘\0’ 结束。否则我们不知道什么时候追加结束
目标字符串也必须以’\0’结束,否则我们不知道什么时候开始追加
目标空间必须有足够的大,能容纳下源字符串的内容。
不能自己追加自己。这是由于开始追加会将目标空间末尾的’\0’覆盖,如果自己追加自己,相当于源字符串末尾的’\0’被覆盖了,从而失去了停止的标志,会陷入死循环。
因此我们可以这样使用它:
#include#includeint main(){ char str1[20] = "hello "; char str2[] = "world"; printf("%s", strcat(str1, str2)); return 0;}
2.3.2 模拟实现
我们可以先找到目标字符串的末尾,然后从此处开始将源字符串的字符拷贝到目标字符串中。代码如下:
#include#include//模拟实现strcatchar* my_strcat(char* dest, const char* src){ assert(dest && src);//断言,保证代码健壮性 char* ret = dest;//保存起始地址,用于返回 //找到dest的末尾 while (*dest) { dest++; } //进行追加拷贝 while (*dest++ = *src++) { ; } return ret;}int main(){ char str1[20] = "hello "; char str2[] = "world"; printf("%s", my_strcat(str1, str2)); return 0;}
2.4 strcmp
2.4.1 基本使用
strcmp的作用是字符串比较,将两个字符串的字符逐一进行比较,其函数原型及说明如下:
由于传入的两个字符串只参与比较,因此加上const修饰符防止被意外修改
strcmp返回值为int类型。当str1str2,返回大于0的数;当str1=str2,返回0。
注意,这里的两个字符串的比较并不是比较两个字符串的长度,而是比较每个字符的ASCII码值。
因此我们可以这样使用它:
#include#includeint main(){ char str1[20] = "hello "; char str2[] = "world"; char str3[20] = "bcdabc"; char str4[] = "bcdabc"; if (strcmp(str1,str2)==0) { printf("str1 == str2"); } else if(strcmp(str1, str2) > 0) { printf("str1 > str2"); } else { printf("str1 < str2\n"); } if (strcmp(str3, str4) == 0) { printf("str3 == str4"); } return 0;}
2.4.2 模拟实现
很简单,我们只需逐一比较每个字符的ASCII码值大小,如果相同则继续比较下一个字符,直到遇到’\0’即可。实现代码如下:
#include#include//模拟实现strcmpint my_strcmp(const char* dest, const char* src){ assert(dest && src); while (*dest == *src)//当前字符相等 { if (*dest == '\0') { //全部字符都相等,两个字符串相等 return 0; } //指向下一字符 dest++; src++; } //不相等,返回ASCII码差值 return *dest - *src;}
2.5 strncpy
2.5.1 基本使用
strncpy的作用也是拷贝字符串。strncpy与strcpy不同的是,它是受指定长度限制的函数,即我们可以指定需要拷贝多少个字符,它的函数原型如下:
与strcpy相比,参数只多了一个num,num代表要拷贝的字符数。从源字符串拷贝num个字符到目标空间
如果num少于源字符的个数,其拷贝后不会在目标的后面加上’\0’。
如果num超过源字符个数,则拷贝完源字符串之后,会在目标的后边追加’\0’,直到总共拷贝num个。
以上两点简单来说就是:strncpy我们指定拷贝多少个其就会拷贝多少个,不会凭空增加也不会凭空消失。
我们可以这样使用它:
#include#includeint main(){ char str1[20] = "hello "; char str2[] = "world"; char str3[20] = "hello "; char str4[] = "world"; printf("%s\n", strncpy(str1, str2,6));//拷贝6个字符包括\0,因此会打印world printf("%s", strncpy(str3, str4, 3));//拷贝3个字符不包括\0,因此会打印worlo
2.6 strncat
2.6.1 基本使用
strncat的作用也是追加字符串。同样的,和strcat不同的是,它是也是受指定长度限制的函数,即我们可以指定需要追加多少个字符,它的函数原型如下:
与strncpy类似,num代表需要追加的字符数。从源字符串拷贝num个字符到目标空间
如果num少于源字符个数,其追加后还会在目标空间的后面加上’\0′
如果num大于源字符串的长度,超过的部分不会像strncpy一样用’\0’填充,而是直接停止。
我们可以这样使用它:
#include#includeint main(){ char str1[20] = "hello "; char str2[] = "world"; printf("%s\n", strncat(str1, str2,5));//将5个字符拷贝过去,并在后面补上'\0' return 0;}
2.7 strncmp
2.7.1 基本使用
相同道理,strncmp也是受指定长度限制的函数,它的功能为字符串比较。我们可以指定需要比较多少个字符,它的函数原型如下:
同理,num代表需要比较的字符数。比较到出现某个字符不一样或者一个字符串结束或者num个字符全部比较完。
返回值与strcmp一样,大于返回大于0的数,小于返回小于0的数,相等返回0。
我们可以这样使用它:
#include#includeint main(){ char str1[20] = "hello "; char str2[] = "world"; char str3[20] = "bcdabc"; char str4[] = "bc"; if (strncmp(str1, str2, 2) != 0)//比较前两个字符,he与wo { printf("str1和str2前两个字符不相等\n"); } if (strncmp(str3, str4, 2) == 0)//比较前两个字符,bc与bc { printf("str3和str4前两个字符相等\n"); } return 0;}
2.8 strstr
2.8.1 基本使用
这个函数可能会有人感到陌生,它的作用是在一个字符串中查找是否存在另一个字符串,它的函数原型如下:
本函数从str1中查找是否存在和str2匹配的子串,如果存在,则返回第一次匹配成功的字符串首地址
我们可以这样使用它:
#include#includeint main(){ char str1[20] = "hello "; char str2[] = "el"; char str3[20] = "bcdabc"; char str4[] = "ad"; printf("%s\n", strstr(str1, str2));//由于str1中存在字串与str2一致,因此返回第一次匹配成功的字符串地址 printf("%s\n", strstr(str3, str4));//由于str3中不存在字串与str4一致,返回NULL return 0;}
2.8.2 模拟实现
法一:暴力查找。通过遍历查找str1中与str2[0]相等的字符,找到后就向后进行匹配,如果匹配成功则返回对应地址,如果匹配失败则继续向后查找下一个与str2[0]相等的字符,循环直到匹配成功或者数组遍历完毕。动态效果及代码如下:
#include#include#include//模拟实现strstr,暴力法char* my_strstr(const char* dest, const char* src){ assert(dest && src); char* p1 = NULL; char* p2 = NULL; char* cp = (char*)dest; while (*cp) { p1 = cp; p2 = (char*)src; //开始匹配 while (*p1 && *p2 && *p1 == *p2) { p1++; p2++; } //全部字符匹配成功 if (*p2 == '\0') { return cp; } //匹配失败,继续向后遍历查找 cp++; } return NULL;//找不到返回空}
法二:KMP算法。这是一种 字符串匹配算法,后续会专门用一篇博客写KMP算法的思想与实现,这里就直接上代码:
#include#include#include#includeint* get_next(const char*src){ assert(src && *src); int sl = strlen(src); int* next=(int*)malloc((sl+1) * sizeof(int)); //赋初值,第一个字符的最长公共前后缀为0 next[1] = 0; next[0] = -1; //开始遍历,对next[j]赋值,j表示第j位字符 int i = 0; int j = 2; while (j <= sl) { if (i == -1||src[i] == src[j-1]) { next[j] = i + 1; //最长公共前后缀 i++; j++; } else //不相等,通过next回溯i { i = next[i]; } } return next;}char* my_strstr_KMP(const char* dest, const char* src){ int* next=get_next(src); int i = 0; int j = 0; while (dest[i]) { if (j == -1 || dest[i] == src[j]) { i++; j++; } else if (!src[j]) //遍历完毕,返回起始的地址 { return &dest[i - j]; } else //通过next回溯j { j = next[j]; } } return NULL;}int main(){ char str1[20] = "hello "; char str2[] = "el"; char str3[20] = "bcdabc"; char str4[] = "ad"; printf("%s\n",my_strstr_KMP(str1,str2)); printf("%s", my_strstr_KMP(str3, str4)); return 0;}
2.9 strtok
2.9.1 基本使用
这个函数的作用按照指定的分隔符来分隔字符串,返回分隔后的字符串,其函数原型及说明如下:
sep参数是个字符串,定义了用作分隔符的字符集合
第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中的一个或者多个分隔符分割的标记。
strtok函数会找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改,即不能是常量字符串)
strtok函数的第一个参数不为 NULL 时,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
如果字符串中不存在更多的标记,则返回 NULL 指针。
根据strtok的特性,我们可以这样使用它:
#includeint main(){ //分隔一个ip地址 char str1[20] = "192.168.1.123";//源字符串 char str2[20] = { 0 }; char* del = ".";//分隔符 strcpy(str2, str1);//由于strtok会修改源字符串,因此拷贝一份来操作 //开始分隔,当返回NULL时结束 for (char* s = strtok(str2, del); s != NULL; s=strtok(NULL, del)) { printf("%s\n", s); } return 0;}
2.10 strerror
2.10.1 基本使用
这个函数的作用是返回一个错误码所对应的错误信息,其函数原型与说明如下:
什么是错误码?
1.错误码是一组数字,它与系统的错误讯息建立关联,每一个错误码都对应着一个错误信息。
2.C语言在库函数调用失败时,会将错误码放在一个叫 errno的变量中,没有错误则置为0。errno变量在errno.h头文件中。
因此,我们可以使用strerror根据errno的值来获取错误信息,也可以将其打印出来,如下:
#include #include #include //必须包含的头文件int main(){ FILE* pFile; pFile = fopen("unexist.ent", "r");//以r的方式打开一个不存在的文件 if (pFile == NULL) { printf("%s\n", strerror(errno));//显示错误信息 } return 0;}
2.11 其他
除以上字符串函数之外,在C语言的 ctype.h 头文件中还有一些十分好用的 字符函数
2.11.1 字符分类函数
函数 | 如果参数符合下列条件就返回真,否则返回假 |
iscntrl() | 任何控制字符 |
isspace() | 空白字符:空格‘ ’,换页‘\f’,换行’\n’,回车‘\r’,制表符’\t’或者垂直制表符’\v’ |
isdigit() | 十进制数字 0~9字符 |
isxdigit() | 十六进制数字,包括所有十进制数字,小写字母a~f,大写字母A~F |
islower() | 小写字母a~z |
isupper() | 大写字母A~Z |
isalpha() | 字母a~z或A~Z |
isalnum() | 字母或者数字,a~z,A~Z,0~9 |
ispunct() | 标点符号,任何不属于数字或者字母的图形字符(可打印) |
isgraph() | 任何图形字符 |
isprint() | 任何可打印字符,包括图形字符和空白字符 |
2.11.2 字符转换函数
int tolower ( int c );//将大写字母转换为小写字母int toupper ( int c );//将小写字母转换为大写字母
2.11.3 示例
#include#include#includeint main(){ //字符转换函数 int i = 0; char str[] = "Hello WorLd"; //将str的大写字符转换为小写字符 while (str[i]) { if (isupper(str[i]))//是大写字符 { str[i] = tolower(str[i]);//转换为小写 } i++; } printf("%s", str); return 0;}
3. 内存函数
以上我们介绍的函数都是用来操作字符串或者字符数组的。而当我们需要操作整形数组,操作结构体数组时,以上函数就失效了,那怎么办呢?下面就要请到我们的内存操作函数了,内存操作函数都定义在 string.h头文件中。
3.1 memcpy
3.1.1 基本使用
memcpy的作用是以字节为单位拷贝内存块,其函数原型及说明如下:
参数的指针用void*来接收是由于设计者并不知道用户将来会传入什么类型的数据
函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
这个函数在遇到 ‘\0’ 的时候并不会停下来。
如果source和destination有任何的重叠,复制的结果都是未定义的,这是由于内存重叠时进行拷贝可能会覆盖尚未拷贝的数据。在不同的编译器下,发生的效果可能会意想不到。如果真的需要拷贝,请使用memmove()函数。
我们可以这样使用它:
#include#includeint main(){ int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 }; int arr2[10] = { 0 }; memcpy(arr2, arr1,40);//从arr1拷贝40个字节到arr2 //my_memmove(arr1, arr1+4, 16); for (int i = 0; i < 10; i++) { printf("%d ", arr2[i]);//打印出arr2元素 } return 0;}
3.1.2 模拟实现
很简单,由于 char*类型的指针每次解引用访问一个字节,我们只需将传入的指针强转为char*指针,然后依次解引用拷贝num个字节到目标数组即可。代码如下:
#include#include#includevoid* my_memcpy(void* dest, void* src, size_t num){ assert(dest && src);//保证传入的指针不为空 void* ret = dest;//用于返回 while (num--)//拷贝num个字节 { //利用char*指针的特性逐一进行拷贝 *(char*)dest = *(char*)src; dest = (char*)dest + 1; src = (char*)src + 1; } return dest;}
3.2 memmove
3.2.1 基本使用
memmove的作用是以字节为单位移动内存块的数据到目标空间。听起来与memcpy没有什么差别,但是memmove对内存块重叠的情况进行了特殊处理,使其可以正确进行拷贝。其函数原型及说明如下:
和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
如果源空间和目标空间出现重叠,就得使用memmove函数处理。
我们可以这样使用它:
#include#include#includeint main(){ int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 }; int arr2[10] = { 0 }; memmove(arr2, arr1, 40);//内存块不重叠 for (int i = 0; i < 10; i++) { printf("%d ", arr2[i]);//打印出arr2元素 } memmove(arr1+2, arr1, 16);//内存块重叠,将1,2,3,4移动到arr+2处 printf("\n"); for (int i = 0; i < 10; i++) { printf("%d ", arr1[i]);//打印出arr1元素 } return 0;}
我们可以看到无论内存块有没有重叠,都能正确的拷贝:
3.2.2 模拟实现
分为以下三种情况:
内存块不重叠
这种情况最好办,就是一般情况,无论从前开始移动还是从后开始移动都不影响结果。
内存块重叠且dest在src后
这种情况我们就不能从前面开始进行移动了,而是要从后面开始移动,我们通过动图来解释:
内存块重叠且dest在src前
而对于这种情况,我们从后面开始移动就失效了,又需要从前面开始移动,动图如下:
总结
我们需要针对不同的情况选择从前开始移动还是从后开始移动。其实我们只要先记住先从重叠的部分开始移动即可。
实现的代码如下:
#include#include#includevoid* my_memmove(void* dest, void* src, size_t num){ assert(dest && src);//保证传入指针不为空 void* ret = dest;//用于返回 //dest<src,如果重叠,则重叠部分在src前面,从前开始移动 if (dest =src,如果重叠,则重叠部分在src后面,从后开始移动。 { while (num--) { *((char*)dest + num) = *((char*)src + num); } } return ret;}int main(){ int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 }; int arr2[10] = { 0 }; my_memmove(arr2, arr1, 40);//内存块不重叠 for (int i = 0; i < 10; i++) { printf("%d ", arr2[i]);//打印出arr2元素 } memmove(arr1+2, arr1, 16);//内存块重叠,将1,2,3,4移动到arr+2处 printf("\n"); for (int i = 0; i < 10; i++) { printf("%d ", arr1[i]);//打印出arr1元素 } return 0;}
3.3 memcmp
3.3.1 基本使用
memcmp函数的作用是以字节为单位对内存空间中的数据进行比较,其函数原型及说明如下:
其比较从ptr1和ptr2指针开始的num个字节
它的返回值如下:
我们可以这么使用它:
#include#include#includeint main(){ int arr1[] = { 1,2,3,4 }; int arr2[] = { 1,2,4,4 }; int n; n = memcmp(arr1, arr2, sizeof(arr1));//比较16个字节 if (n > 0) { printf("arr1 is greater than arr2.\n"); } else if (n < 0) { printf("arr1 is less than arr2.\n"); } else { printf("arr1 is the same as arr2.\n"); } return 0;}
3.4 memset
3.4.1 基本使用
memset函数的作用是以字节为单位设置内存数据,通常用于初始化。其函数原型及说明如下:
我们可以使用它对一段连续的内存空间初始化,通常置为0
使用时需注意是以字节为单位进行设置内存,设置出来每个字节的值是相同的,因此在设置高字节数据具有局限性,例如整形。
由于一个字符只占一个字节,因此memset也可以给字符数组进行赋值。
我们可以这样使用它:
#include#includeint main(){ int arr[10]; char str[] = "abcd"; memset(arr, 0, sizeof(arr));//将整形数组初始化为0 for (int i = 0; i < 10; i++) { printf("%d ", arr[i]); } memset(str, 'x', 2);//将str前两个字符设置为x printf("\n%s", str); return 0;}
4. 写在最后
以上我们只是将一些常见的字符串函数及内存函数进行列举分析。事实上,库里面给我们提供的库函数远远不止这些,有兴趣的小伙伴们可以加以拓展。库里面的每个函数都有它的妙用,给我们带来许多便捷。并且其内部的实现方法有些也非常巧妙,仔细研究的话或许能带来意想不到的事情哦
以上,就是本期的全部内容啦
制作不易,能否点个赞再走呢