Linux线程的创建方式是什么

    线程的概念与实现方式

    线程是进程内部的一条执行序列或执行路径,一个进程可以包含多条线程。

    • 从资源分配的角度来看,进程是操作系统进行资源分配的基本单位。

    • 从资源调度的角度来看,线程是资源调度的最小单位,是程序执行的最小单位

    执行序列就是一组有序指令的集合——函数。

    线程是进程内部的一条执行序列,一个进程至少有一条线程,称之为主线程(main方法代表的执行序列),可以通过线程库创建其他线程(给线程制定一个它要执行的函数),将创建的线程称之为函数线程。

    线程的实现方式

    • 内核级线程(由内核直接创建和管理线程,虽然创建开销较大,但是可以利用多处理器的资源)

    • 用户级线程(由线程库创建和管理多个线程,线程的实现都是在用户态,内核无法感知,创建开销较小,无法使用多处理器的资源)

    • 混合级线程(结合以上两种方式实现,可以利用多处理器的资源,从而在用户空间中创建更多的线程,从而映射到内核空间的线程中,多对多,N:M(N>>M))

    Linux系统实现多线程的方式

    Linux 实现线程的机制非常独特。从内核的角度来说,它并没有线程这个概念。

    Linux 把所有的线程都当做进程来实现。内核并没有为表征线程准备特别的调度算法或定义特别的数据结构。

    相反,线程仅仅被视为一个与其他进程共享某些资源的进程。

    每个线程都拥有唯 一隶属于自己的task_struct,所以在内核中,它看起来就像是一个普通的进程(只是线程和 其他一些进程共享某些资源,如地址空间)

    线程和进程的区别

    • 进程是资源分配最小单位,线程是程序执行的最小单位;

    • 线程间的切换效率相比进程间的切换要高

    • 进程有自己独立的地址空间,每启动一个进程,系统都会为其分配地址空间,建立数据表来维护代码段、堆栈段和数据段,线程没有独立的地址空间,它使用相同的地址空间共享数据;

    • 创建一个线程比进程开销小;

    • 线程占用的资源要⽐进程少很多。

    • 线程之间通信更方便,同一个进程下,线程共享全局变量,静态变量等数据,进程之间的通信需要以通信的方式(IPC)进行;(但多线程程序处理好同步与互斥是个难点)

    • 多进程程序更安全,生命力更强,一个进程死掉不会对另一个进程造成影响(源于有独立的地址空间),多线程程序更不易维护,一个线程死掉,整个进程就死掉了(因为共享地址空间);

    • 进程对资源保护要求高,开销大,效率相对较低,线程资源保护要求不高,但开销小,效率高,可频繁切换;

    多线程开发的三个基本概念

    • 线程 【创建、退出、等待】

    • 互斥锁【创建、销毁、加锁】、解锁】

    • 条件【创建、销毁、触发、广播、等待】

    线程库的使用

    1.创建线程

    #include<phread.h>
    
    int pthread_create(pthread_t *id , pthread_attr_t *attr, void(*fun)(void*), void *arg);
    • id :传递一个pthread_t类型的变量的地址,创建成功后,用来获取新创建的线程的TID

    • attr:指定线程的属性 默认使用NULL

    • fun:线程函数的地址

    • arg:传递给线程函数的参数

    • 返回值,成功返回0,失败返回错误码

    多线程代码示例

    #include<stdio.h>
    #include<stdlib.h>
    #include<assert.h>
    #include<string.h>
    #include<unistd.h>
    
    #include<pthread.h>
    
    //声明一个线程函数
    void *fun(void *);
    
    int main()
    {
    	printf("main start\n");
    
    	pthread_t id;
    	//创建函数线程,并且指定函数线程要执行的函数
    	int res = pthread_create(&id,NULL,fun,NULL);
    	assert(res == 0);
    
    	//之后并发运行
    	int i = 0;	
    	for(; i < 5; i++)
    	{
    		printf("main running\n");
    		sleep(1);
    	}
    
    	printf("main over\n");
    	exit(0);
    }
    
    //定义线程函数
    void* fun(void *arg)
    {
    	printf("fun start\n");
    
    	int i = 0;
    	for(; i < 3;i++)
    	{
    		printf("fun running\n");
    		sleep(1);
    	}
    
    	printf("fun over\n");
    }

    gcc编译代码时报`undifined reference to xxxxx错误,都是因为程序中调用了一些方法,但是没有连接该方法所在的文件,例如下面的情况:

    连接库文件编译成功并执行,这一点在帮助手册中也有提示:Compile and link with -pthread

    比较两次运行的结果发现前三条执行语句时一样的

    结论

    • 创建线程并执行线程函数,和调用函数是完全不同的概念。

    • 主线程和函数线程是并发执行的。

    • 线程提前于主线程结束时,不会影响主线程的运行

    • 主线程提前于线程结束时,整个进程都会结束,其他线程也会结束

    • 创建函数线程后,哪个线程先被执行是有操作系统的调度算法和机器环境决定。

    函数线程在主线程结束后也随之退出,原因:主线程结束时使用的是exit方法,这个方法结束的是进程。

    然而修改代码为:pthread_exit(NULL);此时主线程结束,函数线程会继续执行直至完成。即便如此,我们还是不推荐大家手动结束主线程,我们更喜欢让主线程等待一会。

    给线程函数传参

    ①值传递

    将变量的值直接转成void*类型进行传递

    因为线程函数接受的是一个void*类型的指针,只要是指针,32位系统上都是4个字节,值传递就只能传递小于或等于4字节的值。

    代码示例

    #include<stdio.h>
    #include<stdlib.h>
    #include<assert.h>
    #include<string.h>
    #include<unistd.h>
    
    #include<pthread.h>
    
    void *fun(void *);
    
    int main()
    {
    	printf("main start\n");
    
    	int a = 10;
    	
    	pthread_t id;
    	int res = pthread_create(&id,NULL,fun,(void*)a);
    	assert(res == 0);
    
    	int i = 0;	
    	for(; i < 5; i++)
    	{
    		printf("main running\n");
    		sleep(1);
    	}
    
    	printf("main over\n");
    	exit(0);
    }
    
    
    void* fun(void *arg)
    {
    	int b = (int)arg;
    	printf("b == %d\n",b);
    }

    ②地址传递

    将变量(所有类型)的地址强转成void*类型进行传递,就和在普通函数调用传递变量的地址相似。

    主线程和函数线程通过这个地址就可以共享地址所指向的空间。

    一个进程内的所有线程是共享这个进程的地址空间。

    多线程下进程的4G虚拟地址空间

    一个进程内的所有线程对于全局数据,静态数据,堆区空间都是共享的。

    线程之间传递数据很简单,但是随之带来的问题就是线程并发运行时无法保证线程安全。

    代码示例

    #include<stdio.h>
    #include<stdlib.h>
    #include<assert.h>
    #include<string.h>
    #include<unistd.h>
    
    #include<pthread.h>
    
    int gdata = 10; //.data
    
    void *fun(void *);
    
    int main()
    {
    	int *ptr = (int *)malloc(4);//.heap
        *ptr = 10;
    	
    	pthread_t id;
    	int res = pthread_create(&id,NULL,fun,(void*)ptr);
    	assert(res == 0);
    
        sleep(2);//等待两秒,保证函数线程已经讲数据修改
    
    	printf("main : gdata == %d\n",gdata);
        printf("main : *ptr = %d\n",*ptr);
    
    	exit(0);
    }
    
    
    void *fun(void *arg)
    {
    	int *p = (int*)arg;
    
        gdata = 20000;
        *p = 20;
    
    	printf("fun over\n");
    }

    线程库中的其他方法

    线程退出的三种方式:

    • 线程从执行函数返回,返回值是线程的退出码;

    • 线程被同一进程的其他线程取消;

    • 调用pthread_exit()函数退出;

    等待线程终止

    int pthread_join(pthread_t thread, void **retval);
    args:
        pthread_t thread: 被连接线程的线程号,该线程必须位于当前进程中,而且不得是分离线程
        void **retval :该参数不为NULL时,指向某个位置 在该函数返回时,将该位置设置为已终止线程的退出状态
        return:
        线程连接的状态,0是成功,非0是失败

    当A线程调用线程B并 pthread_join() 时,A线程会处于阻塞状态,直到B线程结束后,A线程才会继续执行下去。当 pthread_join() 函数返回后,被调用线程才算真正意义上的结束,它的内存空间也会被释放(如果被调用线程是非分离的)。

    这里有三点需要注意:

    • 系统仅释放系统空间,你需要手动清除程序分配的空间,例如由 malloc() 分配的空间。

    • 2.一个线程只能被一个线程所连接。

    • 3.被连接的线程必须是非分离的,否则连接会出错。所以可以看出pthread_join()有两种作用:1-用于等待其他线程结束:当调用 pthread_join() 时,当前线程会处于阻塞状态,直到被调用的线程结束后,当前线程才会重新开始执行。2-对线程的资源进行回收:如果一个线程是非分离的(默认情况下创建的线程都是非分离)并且没有对该线程使用 pthread_join() 的话,该线程结束后并不会释放其内存空间,这会导致该线程变成了“僵尸线程”。

    等待指定的子线程结束

    • 等待thread()指定的线程退出,线程未退出时,该方法阻塞

    • result接收thread线程退出时,指定退出信息

    int pthread_join(pthread_t id,void **result)//调用这个方法的线程会阻塞,直到等待线程结束

    代码演示:

    #include<stdio.h>
    #include<stdlib.h>
    #include<assert.h>
    #include<string.h>
    #include<unistd.h>
    
    #include<pthread.h>
    
    int main()
    {
    	printf("main start\n");
    
    	pthread_t id;
    	int res = pthread_create(&id,NULL,fun,NULL);
    	assert(res == 0);
    
    	//之后并发运行
    	int i = 0;	
    	for(; i < 5; i++)
    	{
    		printf("main running\n");
    		sleep(1);
    	}
    	
    	char *s = NULL;
    	pthread_join(id,(void **)&s);
    	printf("join : s = %s\n",s);
    	
    	exit(0);
    }
    
    //定义线程函数
    void* fun(void *arg)
    {
    	printf("fun start\n");
    
    	int i = 0;
    	for(; i < 10;i++)
    	{
    		printf("fun running\n");
    		sleep(1);
    	}
    
    	printf("fun over\n");
    
    	pthread_exit("fun over");//将该字符常量返回给主线程
    }

    此时,主线程完成五次输出,就会等待子线程结束,阻塞等待,子线程结束后,最后,主线程打印join:s = fun over

    关于exit和join的一些详细说明:

    • 线程自己运行结束,或者调用pthread_exit结束,线程都会释放自己独有的空间资源;

    • 若线程是非分离的,线程会保留线程ID号,直到其他线程通过joining这个线程确认其已经死亡,join的结果是joining线程得到已终止线程的退出状态,已终止线程将消失;

    • 若线程是分离的,不需要使用pthread_exit(),线程自己运行结束,线程结束就会自己释放所有空间资源(包括线程ID号);

    • 子线程最终一定要使用pthread_join()或者设置为分离线程来结束线程,否则线程的资源不会被完全释放(使用取消线程功能也不能完全释放);

    • 主线程运行pthrea_exit(),会结束主线程,但是不会结束子线程;

    • 主线程结束,则整个程序结束,所以主线程最好使用pthread_join函数等待子线程结束,使用该函数一个线程可以等待多个线程结束;

    • 使用pthread_join函数的线程将会阻塞,直到被join的函数线程结束,该函数返回,但是它对被等待终止的线程运行没有影响;

    • 如果子线程使用exit()则可以结束整个进程;

    线程属性

    线程具有的属性可以在线程创建的时候指定;

    ——pthread_create()函数的第二个参数(pthread_attr_t *attr)表示线程的属性,在以前的例子中将其值设为NULL,也就是采用默认属性,线程的多项属性都是可以修改的,这些属性包括绑定属性,分离属性,堆栈属性,堆栈大小,优先级。

    系统默认的是非绑定,非分离,缺省1M的堆栈以及父子进程优先级相同

    线程结构如下:

    typedef struct
    {
        int             detachstate;     //线程的分离状态
        int             schedpolicy;    //线程调度策略
        struct sched_param  schedparam; //线程的调度参数
        int             inheritsched;   //线程的继承性
        int             scope;      //线程的作用域
        size_t          guardsize;  //线程栈末尾的警戒缓冲区大小
        int             stackaddr_set; //线程的栈设置
        void*           stackaddr;  //线程栈的位置
        size_t          stacksize;  //线程栈的大小
    } pthread_attr_t;

    每一个属性都有对应的一些函数,用于对其进行查看和修改,下面分别介绍:

    线程属性初始化

    初始化和去初始化分别对应于如下的两个函数:

    #include <pthread.h>
    
    ①int pthread_attr_init(pthread_attr_t *attr);
    ②it pthread_attr_destroy(pthread_attr_t *attr);

    ①功能:

    • 初始化线程属性函数,注意:应先初始化线程属性,再pthread_create创建线程

    参数:

    • attr:线程属性结构体

    返回值:

    • 成功:0

    • 失败:-1

    ②功能:

    • 销毁线程属性所占用的资源函数

    参数:

    • attr:线程属性结构体

    返回值:

    • 成功:0

    • 失败:-1

    线程分离

    线程的分离状态决定一个线程以什么样的方式来终止自己,这个在之前我们也说过了。

    • 默认状态下,线程是非分离状态,意味着原有的线程会等待所创建的线程结束。只有在pthread_join()函数返回后,才能释放创建的线程占用的系统资源,也才能视作该线程终止。

    • 若线程运行结束且无其他线程阻塞等待,则该线程处于分离状态,此时系统资源将立即被释放。应该根据自己的需要,选择适当的分离状态。

    相关API如下:

    #include <pthread.h>
    
    int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate);

    功能:设置线程分离状态

    参数:

    • attr:已初始化的线程属性

    • detachstate: 分离状态

    PTHREAD_CREATE_DETACHED(分离线程)

    PTHREAD_CREATE_JOINABLE(非分离线程)

    返回值:

    • 成功:0

    • 失败:非0

    int pthread_attr_getdetachstate(const pthread_attr_t *attr, int *detachstate);

    功能:获取线程分离状态

    参数:

    • attr:已初始化的线程属性detachstate: 分离状态

    PTHREAD_CREATE_DETACHED(分离线程)

    PTHREAD _CREATE_JOINABLE(非分离线程)

    返回值:

    • 成功:0

    • 失败:非0

    注意:

    当一个线程被设置为分离线程时,假设此时该线程的执行速度非常快,它很可能在pthread_create返回之前就终止; 终止之后将线程号和系统资源移交给其他线程使用,这样调用create就得到了错误的线程号,因此就必须采取一些同步措施,可以在被创建的线程里调用pthread_cond_timedwait函数,让这个线程等待一会儿,留出足够的时间让函数pthread_create返回,设置一段等待时间,是在多线程编程里常用的方法。要避免使用像wait()这样的函数,因为它们会让整个进程进入睡眠状态,而无法解决线程同步问题。

    以上就是Linux线程的创建方式是什么的详细内容,更多请关注其它相关文章!