线程的基础知识
线程的组成。线程有两部分组成。
1、一个是线程的内核对象,操作系统用它来对线程实施管理。内核对象也是系统用来存放线程统计信息的地方。
2、另一个是线程堆栈,它用于维护线程在执行代码时需要的所有函数参数和局部变量。
进程从来不执行任何东西,它只是线程的容器。线程总是在某个进程环境中创建的,而且它的整个寿命期都在该进程中。这意味着线程在它的进程地址空间中执行代码,并且在进程的地址空间中对数据进行操作。因此,如果在单进程环境中,你有两个或多个线程正在运行,那么这两个线程将共享单个地址空间。这些线程能够执行相同的代码,对相同的数据进行操作。这些线程还能共享内核对象句柄,因为句柄表依赖于每个进程而不是每个线程存在。
线程是一种操作系统对象,它表示在进程中代码的一条执行路径。在每一个wi n32的应用程序中都至少有一个线程,它通常被称为主线程或默认线程。在应用程序中也可以自由地创建别的线程去执行其他任务。线程技术使不同的代码可以同时运行。当然,只有在多c p u的计算机上,多个线程才能够真正地同时运行。在单个cpu上,由于操作系统把c p u的时间分成很短的片段分配给每个线程,这样给人的感觉好像是多个线程真的同时运行,他们只是“看起来”同时在运行。
win32是一种抢占式操作系统,操作系统负责管理哪个线程在什么时候执行。如果当线程1暂停执行时,线程2才有机会获得c p u时间,我们说线程1是抢占的。如果某个线程的代码陷入死循环,这并不可怕,操作系统仍会安排时间给其他线程。
创建一个线程
注意:每个线程必须拥有一个进入点函数,线程从这个进入点开始运行。线程函数可以使用任何合法的名字。可以给线程函数传递单个参数,参数的含义由你自己定义。线程函数必须由一个返回值,它将成为该线程的退出代码。线程函数应该尽可能的使用函数参数和局部变量。线程函数类似下面的样子(object pascal):
//注意最后的stdcall,后面我会描述一些有用的东西
function mythread(info : pointer):dword; stdcall;
var
i : integer;
begin
for i := 0 to pinfo(info)^.count-1 do
form1.canvas.textout(pinfo(info)^.x,pinfo(info)^.y,inttostr(i));
result := 0;
end;
上面的的代码功能很简单,你可以在程序中直接调用,例如这样:
type
tinfo = record
count : integer;
x : integer;
y : integer;
end;
pinfo= ^tinfo;
...
procedure tform1.button4click(sender: tobject);
var
ppi : pinfo;
begin
ppi :=allocmem(sizeof(tinfo));
ppi^.count := 1000000;
ppi^.x := 100;
ppi^.y := 400;
mythread(ppi);
end;
当你在一个窗口中用这样的方式调用时,你会发现在执行的过程中,你将无法在窗口上进行其他操作,因为它工作于你程序的主线程之中。如果此时,你还希望窗口可以进行其他操作。怎么办?让它在后台工作,让它成为另一个线程,使得不同的代码可以同时运行。
做法很简单,如果想要创建一个或多个辅助线程,只需要让一个已经在运行的线程来调用createthread,原型如下:
handle createthread(
lpsecurity_attributes lpthreadattributes, // pointer to thread security attributes
dword dwstacksize, // initial thread stack size, in bytes
lpthread_start_routine lpstartaddress, // pointer to thread function
lpvoid lpparameter, // argument for new thread
dword dwcreationflags, // creation flags
lpdword lpthreadid // pointer to returned thread identifier
);
当createthread,被调用时,系统创建一个线程内核对象。该线程内核对象不是线程本身,而是操作系统用来管理线程的较小的数据结构。可以将线程内核对象视为由关于线程的统计信息组成的一个小型数据结构。系统从进程的地址空间中分配内存,供线程的堆栈使用。新线程运行的进程环境与创建线程的环境相同。因此,新线程可以访问进程的内核对象的所有句柄、进程中的所有内存和在这个相同的进程中的所有其他线程的堆栈。这使得单个进程中的多个线程确实能够非常容易地互相通信。
下面来说这个函数的几个参数:
1、psa 此参数是指向security_attributes结构的指针。如果想要该线程内核对象的默认安全属性,可以(并且通常能够)传递null。如果希望所有的子进程能够继承该线程对象的句柄,必须设定一个security_attributes结构,它的binherithandle(是否可继承)成员被初始化为true,关于security_attributes,因为此文的目的不是介绍它,所以这里不做详细介绍,具体可以参考msdn。通常使用,我们传递null就够了。
2、cbstack 用于设定线程可以将多少地址空间用于它自己的堆栈。当调用cratethread时,如果传递的值不是0,就能使该函数将所有的存储器保留并分配给线程的堆栈。由于所有的存储器预先作了分配,因此可以确保线程拥有指定容量的可用堆栈存储器。通常状况下,我们会设置为0。
3、pfnstartaddr and pvparam,pfnstartaddr 参数用于指明想要新线程执行的线程函数的地址。线程函数的pvparam参数与原先传递给createthread的pvparam参数是相同的。createthread使用该参数不做别的事情,只是在线程启动执行时将该参数传递给线程函数。该参数提供了一个将初始化值传递给线程函数的手段。该初始化数据既可以是数字值,也可以是指向包含其他信息的一个数据结构的指针。此时回头再去看我上面例子上的mythread,你会发现它由一个无类型的指针参数(用c来描述,应该是pvoid),在创建线程时,这个参数就通过pvparam来赋值。
4、fdwcreate 此参数可以设定用于控制创建线程的其他标志。它可以是两个值中的一个。如果该值是0,那么线程创建后可以立即进行调度。如果该值是create_ suspended,系统可以完整地创建线程并对它进行初始化,但是要暂停该线程的运行,这样它就无法进行调度。在delphi的windows.pas单元,你可以发现它的定义
create_suspended= $00000004;
5、pdwthreadid 最后一个参数必须是dword的一个有效地址,createthread
使用这个地址来存放系统分配给新线程的id.
有了上面这些基础,下面我们就使用createthread来创建刚才那个mythread线程(delphi7);
...
//一个自定义类型
type
tinfo = record
count : integer;//计数器个数
x : integer;//要显示在窗体上位置的横座标
y : integer;//纵坐标
end;
pinfo=^tinfo;
var
mythreadhad : thandle;//一个全局变量,用来接受createthread创建新线程的句柄
...
procedure tform1.button4click(sender: tobject);
var
ppi : pinfo;
mythreadid : dword;
begin
{分配空间,注意,因为这里我只是一个用来演示createthread使用的代码,所以没有释放pp,但优秀的代码最后记得分配了空间一定要释放}
ppi :=allocmem(sizeof(tinfo));
//初始化
ppi^.count := 100000;
ppi^.x := 100;
ppi^.y := 400;
//下面这行代码是关键
mythreadhad := createthread(nil,0,@mythread,ppi,0,mythreadid);
end;
执行此段代码,你会发现,它依然会在屏幕指定区域输出文字,和最开始时我们用把mythread在主线程中运行不同的是,此时,你依然可以对窗口进行其他操作。
看代码的最后一行,它使用了createthread,看它的参数,第一个nil以及第二个0意外着,它使用默认的安全设置以及默认的线程堆栈大小,第三个参数是mythread的地址(注意@符号),然后我们传递了ppi这个pinfo类型的指针,使得线程函数接受一个参数,如果你不准备让线程接受这个参数,用nil,fdwcreate参数,我们赋值为0,意味着我们希望线程立即执行,最后一个参数用来接受新线程的id。
让我们来看看createthread都干了些什么。

上图显示了系统在创建线程和对线程进行初始化时必须做些什么工作。调用createthread可使系统创建一个线程内核对象。该对象的初始使用计数是2(在线程停止运行和从createthread返回的句柄关闭之前,线程内核对象不会被撤消)。线程的内核对象的其他属性也被初始化,暂停计数被设置为1,退出代码始终为still_active(0 x 1 0 3),该对象设置为未通知状态。
一旦内核对象创建完成,系统就分配用于线程的堆栈的内存。该内存是从进程的地址空间分配而来的,因为线程并不拥有它自己的地址空间。然后系统将两个值写入新线程的堆栈的上端(线程堆栈总是从内存的高地址向低地址建立)。写入堆栈的第一个值是传递给createthread的pvparam参数的值。紧靠它的下面是传递给createthread的pfnstartaddr参数的值。每个线程都有它自己的一组c p u寄存器,称为线程的上下文。该上下文反映了线程上次运行时该线程的cpu寄存器的状态。线程的这组c p u寄存器保存在一个context结构。context结构本身则包含在线程的内核对象中。
指令指针和堆栈指针寄存器是线程上下文中两个最重要的寄存器。线程总是在进程的上下文中运行的。因此,这些地址都用于标识拥有线程的进程地址空间中的内存。当线程的内核对象被初始化时,context结构的堆栈指针寄存器被设置为线程堆栈上用来放置pfnstartaddr的地址。当线程完全初始化后,系统就要查看create_suspended标志是否已经传递给createthread。如果该标志没有传递,系统便将线程的暂停计数递减为0,该线程可以调度到一个进程中。然后系统用上次保存在线程上下文中的值加载到实际的c p u寄存器中。这时线程就可以执行代码,并对它的进程的地址空间中的数据进行操作。
在这里,我还要简单的描述一下context结构,因为win32是抢占式操作系统,一个线程几乎不可能永远的占据cpu,也就是说,它会在一定时间后(在windows中,大概式20ms的时间),被cpu放在一边,一段时间之后,才可以重新获得cpu时间片,此时就有一个问题,线程现在执行到了那里,cpu在再次分配给它时间片执行的时候,必须知道这些信息,难道要从0开始吗?context结构的作用就是用来解决这个问题。
在platform sdk中,你可以看到下面的信息:
“context结构包含了特定处理器的寄存器数据。系统使用context结构执行各种内部操作。目前,已经存在为intel、mips、alpha和powerpc处理器定义的context结构。若要了解这些结构的定义,参见头文件winnt.h”。
该文档并没有说明该结构的成员,也没有描述这些成员是谁,因为这些成员要取决于windows在哪个cpu上运行。实际上,在windows定义的所有数据结构中,context结构是特定于cpu的唯一数据结构。那么context结构中究竟存在哪些东西呢?它包含了主机c p u上的每个寄存器的数据结构。在x86计算机上,数据成员是eax、ebx、ecx、edx等等。如果是alpha处理器,那么数据成员包括intv0、intt0、intt1、ints0、in tra和intzero等等。
windows实际上允许查看线程内核对象的内部情况,以便抓取它当前的一组cpu寄存器。若要进行这项操作,只需要调用getthreadcontext函数。关于此函数的使用,我们下次再说。
线程的终止
终止一个线程的运行,有4个方法:
1、线程函数返回,这是最好的
2、调用exitthread函数,线程将自动撤销
3、调用terminatethread函数
4、包含线程的进程终止运行
线程函数返回
始终都应该将线程设计成这样的形式,即当想要线程终止运行时,它们就能够返回。这是确保所有线程资源被正确地清除的唯一办法。如果
线程能够返回,就可以确保下列事项的实现:
• 在线程函数中创建的所有c + +对象均将通过它们的撤消函数正确地撤消。
• 操作系统将正确地释放线程堆栈使用的内存。
• 系统将线程的退出代码(在线程的内核对象中维护)设置为线程函数的返回值。
• 系统将递减线程内核对象的使用计数。
调用exitthread函数
void exitthread(dword dwexitcode);
该函数将终止线程的运行,并导致操作系统清除该线程使用的所有操作系统资源。但是程序中用到的资源(例如delphi类对象)将不被撤消。
调用terminatethread函数
bool terminatethread(handle hthread,dword dwexitcode);
关产这个函数和exitthread的区别,你会发现它除了有dwexitcode这个退出码参数之外,还包含了可指定线程的句柄参数。看到这里你就应该会想到两者的区别,exitthread总是撤消调用的线程,而terminatethread能够撤消任何线程。hthread参数用于标识被终止运行的线程的句柄。当线程终止运行时,它的退出代码成为你作为dwexitcode参数传递的值。同时,线程的内核对象的使用计数也被递减。值得注意的是,此函数是异步运行的函数,也就是说,它告诉系统你想要线程终止运行,但是,当函数返回时,不能保证线程被撤消。如果需要确切地知道该线程已经终止运行,必须调用waitforsingleobject或者类似的函数,传递线程的句柄。
在进程终止时撤销线程
这是很容易想到的。无须过多解释。
线程终止时发生的操作
当线程终止运行时,会发生下列操作:
• 线程拥有的所有用户对象均被释放。在windows中,大多数对象是由包含创建这些对象的线程的进程拥有的。但是一个线程拥有两个用户对象,即窗口和挂钩。当线程终止运行时,系统会自动撤消任何窗口,并且卸载线程创建的或安装的任何挂钩。其他对象只有在拥有线程的进程终止运行时才被撤消。
• 线程的退出代码从still_active改为传递给exitthread或terminatethread的代码
• 线程内核对象的状态变为已通知。
• 如果线程是进程中最后一个活动线程,系统也将进程视为已经终止运行。
• 线程内核对象的使用计数递减1。当一个线程终止运行时,在与它相关联的线程内核对象的所有未结束的引用关闭之前,该内核对象不会自动被释放。
一旦线程不再运行,系统中就没有别的线程能够处理该线程的句柄。然而别的线程可以调用getexitcodethread来检查由hthread标识的线程是否已经终止运行。如果它已经终止运行,则确定它的退出代码.
bool getexitcodethread(handle hthread,pdword pdwexitcode);
退出代码的值在pdwexitcode);指向的dword中返回。如果调用getexitcodethread时线程尚未终止运行,该函数就用still_active标识符(定义为0x103)填入dword。如果该函数运行成功,便返回t r u e。
上面描述了结束线程的多种办法,这里必须说明一点,如果有可能,那尽量使用第一种方式来结束线程,它可以确保你释放了所有的资源。好的程序应该尽可能的减少对客户资源的浪费。
stdcall
准确的说,stdcall这个标示符本来和线程没有直接的联系,但因为我这里的示例代码是用object pascal写的,而我们调用的createthread则是用c实现的,这两种语言的函数入栈的方式是不同的,pascal是从左到右。加上stdcall,可以使得入栈方式改为从右到左以符合别的语言的习惯。我们上面调用createthread函数时,因为我传递了那个无类型的指针参数,所以,必须加上stdcall指明入栈方式,否则会出现地址访问错误。当然,如果你并不决定传递参数,你也可以不使用stdcall。不过作为一种好的编码习惯,你最好还是加上。
delphi中创建线程
如果你只想做一个代码搬运工,你完全可以不了解上面的内容,但如果你想成为一个合格的win32程序员,深入这些内容,比你肤浅的多学一门语言有用。
delphi把有关线程的api封装在tthread这个object pascal的对象中。结合上面的内容,先去看tthread源码
tthread = class
private
{$ifdef mswindows}
fhandle: thandle;
fthreadid: thandle;
{$endif}
{$ifdef linux}
// ** fthreadid is not thandle in linux **
fthreadid: cardinal;
fcreatesuspendedsem: tsemaphore;
finitialsuspenddone: boolean;
{$endif}
fcreatesuspended: boolean;
fterminated: boolean;
fsuspended: boolean;
ffreeonterminate: boolean;
ffinished: boolean;
freturnvalue: integer;
fonterminate: tnotifyevent;
fsynchronize: tsynchronizerecord;
ffatalexception: tobject;
procedure callonterminate;
class procedure synchronize(asyncrec: psynchronizerecord); overload;
{$ifdef mswindows}
function getpriority: tthreadpriority;
procedure setpriority(value: tthreadpriority);
{$endif}
{$ifdef linux}
// ** priority is an integer value in linux
function getpriority: integer;
procedure setpriority(value: integer);
function getpolicy: integer;
procedure setpolicy(value: integer);
{$endif}
procedure setsuspended(value: boolean);
protected
procedure checkthreaderror(errcode: integer); overload;
procedure checkthreaderror(success: boolean); overload;
procedure doterminate; virtual;
procedure execute; virtual; abstract;
procedure synchronize(method: tthreadmethod); overload;
property returnvalue: integer read freturnvalue write freturnvalue;
property terminated: boolean read fterminated;
public
constructor create(createsuspended: boolean);
destructor destroy; override;
procedure afterconstruction; override;
procedure resume;
procedure suspend;
procedure terminate;
function waitfor: longword;
class procedure synchronize(athread: tthread; amethod: tthreadmethod); overload;
class procedure staticsynchronize(athread: tthread; amethod: tthreadmethod);
property fatalexception: tobject read ffatalexception;
property freeonterminate: boolean read ffreeonterminate write ffreeonterminate;
{$ifdef mswindows}
property handle: thandle read fhandle;
property priority: tthreadpriority read getpriority write setpriority;
{$endif}
{$ifdef linux}
// ** priority is an integer **
property priority: integer read getpriority write setpriority;
property policy: integer read getpolicy write setpolicy;
{$endif}
property suspended: boolean read fsuspended write setsuspended;
{$ifdef mswindows}
property threadid: thandle read fthreadid;
{$endif}
{$ifdef linux}
// ** threadid is cardinal **
property threadid: cardinal read fthreadid;
{$endif}
property onterminate: tnotifyevent read fonterminate write fonterminate;
end;
从tthread的声明中可以看出,它定义了windows和linux下分别要完成的操作,这里我们只谈win32,tthread直接从tobject继承,因为,它不是组件。你还可以看到它有一个execute的方法
procedure execute; virtual; abstract;
并且你可以看到,它是抽象的,因为,不能创建tthread的实例,你只能创建它的派生类的实例。再去看看它的构造函数,你会看到这样一句代码
fhandle := beginthread(nil, 0, @threadproc, pointer(self), create_suspended, fthreadid);再深入去看这个beginthread,
result := createthread(securityattributes, stacksize, @threadwrapper, p,creationflags, threadid);你看到了什么?是的,createthread,结合这两句,看看它都干了些什么,默认的安全属性,默认的堆栈大小,一个入口地址,一个参数,一个创建标志,还有一个threadid。你和本文最开始的那些内容对上了吗?我们又看到它传递的线程函数是threadproc,再去看看它。下面只帖了一些和本文有关系的代码
try
if not thread.terminated then
try
thread.execute;
except
thread.ffatalexception := acquireexceptionobject;
end;
finally
它首先根据tthread类中的一个属性terminated(布尔类型)来判断线程的状态,如果你没有通过外部代码将terminated甚至为true,它将会执行execute(注意这个方法,我们刚才提到过它是一个抽象的,你必须让它干点什么,也就是说,tthread.execute将是你的线程将要执行的操作)。然后是异常的处理。你是否对delphi的tthread有点了解了呢?如果有兴趣,好好看看它的源码吧。
说到这里,delphi中tthread创建一个线程的基本流程就出来了。调用自己的构造函数,传递一个布尔类型的变量,这个变量对应createthread函数的fdwcreate参数,用来决定线程是立即执行还是挂起,构造函数又调用了一个beginthread,而正是这个beginthread调用了win api createthread,它将一个threadproc线程函数传递给createthread,而这个threadproc则调用你必须覆盖的方法execute来完成你想要进行的操作。
再来看看它的终止,继续刚才的内容,看threadproc这个函数的下面代码,你会发现,当execute执行完毕之后,它就认为这个线程终止了,它调用了endthread(result),然后这个endthread又调用了exitthread(exitcode)。当结束使用tthread对象时,应该确保已经把这个object pascal对象从内存中清除了。这才能确保所有内存占有都释放掉。尽管在进程终止时会自动清除所有的线程对象,但及时清除已不再用的对象,可以使内存的使用效率提高。还是threadproc的源码,你会发现当线程的execute执行完之后,它要根thread.ffreeonterminate来决定是否释放资源。freethread := thread.ffreeonterminate;...if freethread then thread.free;这是非常好的,也就是说,你可以通过在对freeonterminate这个属性赋值为true(观察它的源码,freeonterminate是ffreeonterminate这个私有变量的访问器),来让tthread对象自动在线程执行完毕之后自动释放资源。
看了这么多,我们可以梳理一下思路了,使用tthread对象,我们必须从它派生一个类,然后你必须覆盖execute这个方法,在这里,完成你要让线程做的事情。如果有可能(或者说尽量,除非你对这个线程还有别的需求),还可以在这里通过设置freeonterminate := true,使得线程在执行完毕之后自动释放资源。我们可以通过tthread对象构造函数的参数来决定线程是否立即运行。
一个例子:
...
//声明一个线程,我们叫它tfrist
tfrist = class(tthread)
protected
procedure execute;override;//覆盖execute这个抽象的方法,这是你必须做的事情
end;
var
form1: tform1;
ci : array[0..1000] of integer;//一个全局变量,我们将用tfrist来访问它
...
{ tfrist }
procedure tfrist.execute;
var
i : integer;
begin
inherited;
onterminate := form1.threaddone;//注意一下这里
freeonterminate := true;
for i := 0 to 1000 do
ci[i] := i;
end;
procedure tform1.button1click(sender: tobject);
begin
//初始化全局变量
fillmemory(@ci,1000,0);
tfrist.create(false);
end;
procedure tform1.threaddone(sender: tobject);
var
i : integer;
begin
for i := 0 to 1000 do
listbox1.items.add(inttostr(ci[i]))
end;
上面我省略了一些代码,但大意已表。我们声明了一个tfrist的类,它从tthread继承而来,它将对一个全局变量的的数组ci进行初始化,并且将初始化的结果显示在窗体的listbox1上。
写到这里,你会发现上述代码中的几个“疑点”,其中一个我现在要说明的就是onterminate := form1.threaddone;这一句,观察threaddone的源码,你会发现它其实就是完成将全局变量的内容显示在窗体的listbox中,这时,你可能会问,直接写在线程里,不可以吗?为什么要这样?原因很简单。大多数v c l在被设计时,都只考虑了在任何时刻只有一个线程来访问它。其局限性尤其体现在v c l的用户界面部分。同时,一些非用户界面部分也不是线程安全的。
1. 非用户界面的v c l
实际上v c l只有很少的部分保证是线程安全的。可能在这很少的部分中,最让人注意的是v c l的属性流机制。v c l的流机制确保了组件流能被多线程安全地读写。请记住即使最基础的v c l类(诸如tlist),也不是为安全地同时操作多个线程而设计的。对某些情况, v c l提供了一些线程安全的替代,比如,用tthreadlist 来替代tlist可以解决多个线程操作的问题。
2. 用户界面的v c l
v c l要求所有的用户界面控制要发生在一个应用程序的主线程的环境中(线程安全的tcanvas类除外)。当然,利用技术手段是可以有效地利用附属线程更新用户界面的(后面将会讨论)。
对v c l的访问只能在主线程中。这将意味着:所有需要与用户打交道的代码都只能在主线程的环境中执行。这是其结构上明显的不足,并且这种需求看起来只局限在表面上,但它实际上有一些优点。首先,只有一个线程能够访问用户界面,这减少了编程的复杂性。win32要求每个创建窗口的线程都要使用getmessage()建立自己的消息循环。正如你所想的,这样的程序将会非常难于调试,因为消息的来源实在太多了。其次,由于v c l只用一个线程来访问它,那些用于把线程同步的代码就可以省略了,从而改善了应用程序的性能。
那么,如果有多个线程要访问vcl,怎么办呢?有这么几个方法:
1、利用tthread的onterminate属性,它是一个tnofityevent类型,它指定的过程将在线程执行完毕之后运行,并且是运行在主线程环境中的,我上面的代码就是使用了这种方法
2、利用tthread的synchronize,
class procedure synchronize(asyncrec: psynchronizerecord); overload;
它的作用是在主线程中执行一个方法,我们上面的例子,如果不用onterminate,那么可以这么改,
tfrist = class(tthread)
private
procedure getresut;//我们声明了一个过程getresutlt;它不包含任何参数
protected
procedure execute;override;
end;
//getresut的实现部分
procedure tfrist.getresut;
var
i : integer;
begin
for i := 0 to 1000 do
form1.listbox1.items.add(inttostr(ci[i]))
end;
procedure tfrist.execute;
var
i : integer;
begin
inherited;
onterminate := form1.threaddone;
// freeonterminate := true;
for i := 0 to 1000 do
ci[i] := i;
//调用synchronize
synchronize(getresut);
end;
3、利用通讯来完成。例如我们可以利用消息,看上面的execute,在它的循环执行完毕之后,我们可以发送一个自定义消息,然后窗口处理这个消息。
参考文献:
1、《delphi5开发人员指南》
2、《windows核心编程》
注:转载请著名出处,谢谢!
未完待续!
源自:简单就是美 (个人网站) 标签:.net
文章整理:西部数码--专业提供域名注册、虚拟主机服务
http://www.west263.com
以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!


