多线程可以同时使用 CPU 的多个核心?

2016-06-14 10:33:28 +08:00
 LinJunzhu

我们知道,单核 CPU 在同一时间内只能够运行一个进程。而在同一时间内也是只能够运行同一个线程,只不过由于时间片轮转的制度才让我们看起来像同时运行多线程。

但昨天在网上搜的资料让我有点懵,有这样的观点:

「单进程多线程可以同时用到 CPU 的双核心」

一直以来我都是认为, CPU 的双核可以同时 hold 住两个进程,但是跟线程并没有关系吧??

不知道大家是怎样认为的?

27679 次点击
所在节点    Linux
21 条回复
Neveroldmilk
2016-06-14 10:41:34 +08:00
CPU 工作的分配一般是以线程为级别的,只不过大部分程序一个进程只用一个线程,所以看起来好像 CPU 只能是以进程位粒度分配任务。
fds
2016-06-14 10:45:56 +08:00
摘抄:总而言之:进程是组织资源的最小单位,而线程是安排 CPU 执行的最小单位。
http://www.cnblogs.com/CareySon/archive/2012/05/04/ProcessAndThread.html
bingliu221
2016-06-14 10:46:11 +08:00
进程描述的是资源分配的单位,一个进程里面的所有线程都可以共享这些资源。
线程是 CPU 调度的单位,一个逻辑 CPU 核心在某一时刻只能 hold 住一个线程。

操作系统原理的基础内容,楼主可以找本书过一下。
好久没碰这些概念了,不知道我说得有没有严谨。
vexxx
2016-06-14 11:05:38 +08:00
讲个通俗不严谨的说法, CPU 看到的是线程,看不到进程,进程是 OS 上的概念。与 lz 之前的想法恰恰相反。
ryd994
2016-06-14 11:27:52 +08:00
在 Linux 里,创建新进程和新线程可以用同一个系统调用,唯一的区别是,创建新线程时不创建行调用栈。而且你仔细看, tid 和 pid 其实是在同一个范围里
主进程 tid=pid
子进程很多时候就是主进程 pid+n
而后面其他新进程会顺延下去
所以,其实进程和线程的区别只在于内存空间是不是共享而已………
2225377fjs
2016-06-14 11:30:25 +08:00
多线程当然可以利用多核,调度单元是线程,不是进程。
不然 Java 程序的 1600%的 CPU 利用率是怎么跑出来的。。?(同时占满 16 个 CPU 核心)
shrimp929
2016-06-14 11:49:04 +08:00
对于 CPU 而言,看到的是线程,多核 CPU 可以同时调度多个线程执行。我想楼主可能不是很理解线程的意义把。一个进程有多个线程的好处:对于单核 CPU 而言,CPU每次只能调度 1 个线程,但是若当前线程阻塞了, CPU 可以不必等待,而是先调用别的线程执行,这样就提高了 CPU 的利用率
VVJiao
2016-06-14 12:12:32 +08:00
你需要搞明白并发 concurrent 与并行 parallel 的区别
SakuraSa
2016-06-14 12:32:44 +08:00
被 GIL 锁住的 python 流下了悲痛的眼泪……
zhicheng
2016-06-14 12:54:43 +08:00
“你认为” 和 “大家认为” 怎么样并没有用,不如多看看书。

最早 UNIX 的调度是以 “进程” 为最小调度单位,那个时候还没有线程的概念。线程有两种,一种是 “用户态线程” ,对内核不可见,内核不可以调度,现在一般叫做纤程或协程。另一种是 “内核态线程”,由内核调度,也称作轻量进程 LWP 。现在说的线程,一般不特殊指定,都是内核线程。

能不能利用多核的关键是能不能被内核调度,既然内核态线程可以被调度,自然可以利用多核。

另外只要资源足够(内存) CPU 可以 hold 住任意多的进程或线程,这与 CPU 的核数无关。你在这里指的应该是 “运行” 。
owt5008137
2016-06-14 13:00:16 +08:00
赞同 @zhicheng 的说法,并且现在的操作系统内核的话答案基本上都是可以。
linux , unix like 的大多数内核和 windows 都可以
ceyes
2016-06-14 13:15:27 +08:00
tkisme
2016-06-14 15:20:27 +08:00
lujun9972
2016-06-14 17:09:01 +08:00
@zhicheng 的解释很到位, kernel thread 可以利用多 CPU , user thread 不能利用多 CPU
sitelogin
2016-06-14 17:50:00 +08:00
进程是空间,线程是时间
FrankHB
2016-06-20 09:18:53 +08:00
“单核 CPU 在同一时间内只能够运行一个进程”当然是错的。“单进程多线程可以同时用到 CPU 的双核心”在主流操作系统上没有问题。
因为同时多线程(SMT),现代超标量处理器(一个 CPU 物理核心)可以同时跑超过一个线程(否则执行单元空着太浪费),例如 Intel 的 hyperthreading 支持一个物理核心跑两个线程。讲几核的 CPU 的核心数一般直接指物理核心数,如果是指逻辑核心数一般直接会说线程数,几个逻辑核心就同时支持几套架构状态和几个线程。
对操作系统内核 /执行体来说,直接可见的 CPU 资源是逻辑核心,可以调度的任务一般直接实现成 CPU 支持的线程,所以单核 CPU 可以同时跑多个任务。不同操作系统中任务的概念不一样。例如 Windows NT 调度的是线程,进程只是线程的容器; Linux 内核不区分进程或者线程,调度的任务在用户空间可以被实现成一个进程或进程中的线程。
注意用户空间的线程和 CPU 上跑的线程不是一回事,只不过流行的系统很多直接采用 1:1 映射简化实现罢了。
LinJunzhu
2016-06-21 14:41:15 +08:00
一个星期没上来看,看到大家这么热心的回复,很是感谢,也明白了一些概念。

现在又有一个新的问题:

既然多线程可以利用到 CPU 的多核多线程。

那我现在有个 project, 我直接开 单进程多线程 不就可以了吗?多进程还有存在的必要?
LinJunzhu
2016-06-21 14:42:01 +08:00
zhicheng
2016-06-21 18:51:08 +08:00
你先去看一下书再来提问吧,随便一本操作系统原理都可以。

现代操作系统进程代表的是地址空间 (Address Space)。目的是隔离,一个进程不可以直接访问另一个进程的内存空间,这是由操作系统内核保护的。

估计你要问为什么隔离?我不告诉你。自己看书。
LinJunzhu
2016-06-24 16:47:39 +08:00
@zhicheng

唔.. 其实你说的这些我也懂。

只是突然有点疑惑,那这样的话是 「多进程单线程」 的效率高还是 「单进程多线程」 的效率高。

多线程的话考虑到会抢占资源,所以会有锁的存在,影响效率
多进程的话由于要 fork 两份一模一样的数据,并且要 CPU 要切换进程,也会耗费不少资源

不过这还是要根据不同情况分析。如果是 Python Ruby 等有 GIL 锁的语言,那肯定是多进程的效率要更优。

谢谢啦 :)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/285551

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX