你还有SM and sp的无限小说网吗?

这是一个主的微博他露脸公开,而且微博还有同学关注他我觉得很厉害,等同于告诉世人我是约炮大王,我很脏我是鸭子一样的人

最近应用开发的过程中出现了一個小问题顺便记录一下原因和方法--数量线程

    这里为什么要有一个间中的次层block呢?这是因为CUDA通过这个念概供给了细粒度的通信段手,因為block是加载在SM上行运的所以可以利用SM供给的shared memory和__syncthreads()能功现实线程同步和通信,这带来了很多处好而block之间,除了结束kernel外之是没法同步的一般吔不证保行运先后顺序,这是因为CUDA序程要证保在不同范围(不同SM数量)的GPU上都可以行运必须备具范围的可扩展性,因此block之间不能有依附

古人云:“海纳百川,有容乃大”人世间,不可能没有矛盾和争吵我们要以磊落的胸怀和宽容的微笑去面对它 。哈伯德也曾说过:“宽恕和受宽恕的难以言喻的快乐是连神明都会为之羡慕的极大乐事。”让我们从宽容中享受快乐从谅解中体会幸福吧!

2:kepler构架下的SM(又称SMX)是具有192个SP(又称CUDA CORE)没错,因而应用总的SP数量除以192即得 SM数量您的懂得是确正的。3:这个问题说起来略微有点庞杂因为这个和该block應用资源的情况有关,一般情况下是没法到达1/7的,也就是说只上一个block的话极可能一个SM都跑不满(比如这个block面里线程数量非常少,或者線程数量中等但是仍然没法盖掩其他的迟延等)同时一个block最大只能有1024个线程这对于GPU算计还是少了些。单简地借用一个数学的念概来说明鈳能更为明白:“1/7是您GPU占用率的‘上界’但可能不是‘上确界(小最上界)’,同时这样做一般来说线程数量太少,没有意义”

文嶂结束给大家分享下程序员的一些笑话语录: PC软件体积大,是因为一个PC软件功能往往较多能够满足你一个方面的需求,而一个iphone软件往往沒几行代码干一件很小的事情,自然需要的软件就多就像吃西瓜和吃瓜子的来比数目,单位不同啊

      最近学习CUDA写了个小程序,由于程序需要设置Block的尺寸为:5*5,然后Grid尺寸:4*4运行之。然后第二次设置Grid尺寸为:8*8第三次为16*16,第四次为32*32结果16*16的是最快的(Geforce GT 755M,2个SM)然后到Tesla(30SM)上去运行相同的程序,结果在相同Grid尺寸情况下Tesla上还没有GT的块!按理说SM越多程序会越快,但是结果却让我大跌眼镜不知道是我的程序的Kernel部分没有设计好还是怎么的(结果和单机对比后是正确的,可能多半是Kernel设计有问题)

我要回帖

更多关于 sp和sm的区别 的文章

 

随机推荐