V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Hoshinokozo
V2EX  ›  Apple

关于 M1,这篇文章做了比较详尽的解释

  •  5
     
  •   Hoshinokozo · 2020-11-19 14:40:13 +08:00 · 14954 次点击
    这是一个创建于 1498 天前的主题,其中的信息可能已经有所发展或是发生改变。

    https://www.zhihu.com/question/429725810/answer/1570340259

    以我有限的知识,整篇文章读下来,一句话总结:M1 是牺牲了 CPU 的灵活性(通用性能)换取了一部分领域的高性能,具体表现为以下几点:

    • 超宽执行架构,加上短流水线,IPC 远强于窄架构的 X86,单核性能爆炸
    • 片上内存( UMA ),内存带宽和延迟相较于板载双通道均有相当优势
    • 多种相对独立的专用处理单元:如图像处理、视频编解码、音频处理、加密解密等,相比 CPU 软解就是降维打击

    相对地,M1 缺点如下:
  • 超宽执行架构是的 M1 的每个核心晶体管消耗量远大于 X86,加上各种专用单元,8 核的 M1 就已经堆了 16B 的晶体管,即使是 5nm 也快到极限了,所以 M1 架构堆核的成本远高于 X86,在遇到吃多核性能,且 M1 的各种加速单元都不顶用的通用计算场景时,会被多核 X86 暴打( AMD YES )

  • 片上内存( UMA )带来了大内存带宽和低延迟,但是无法单独扩展,只能整个 SOC 一起换,目前 M1 最大只支持 16G 内存,这对于一些对大内存有刚性需求的用户来说基本等于告别了

  • 大量加速单元使用了固化硬件电路,若未来业界对某项功能处理使用了新算法的话,要么重新设计新架构,要么就只能靠 CPU 来算了
  • 107 条回复    2020-11-20 16:46:19 +08:00
    1  2  
    lvybupt
        1
    lvybupt  
       2020-11-19 14:59:50 +08:00   ❤️ 2
    “ 超宽执行架构是的 M1 的每个核心晶体管消耗量远大于 X86,加上各种专用单元,8 核的 M1 就已经堆了 16B 的晶体管,即使是 5nm 也快到极限了,所以 M1 架构堆核的成本远高于 X86,在遇到吃多核性能,且 M1 的各种加速单元都不顶用的通用计算场景时,会被多核 X86 暴打( AMD YES )”

    我读了两遍也没看到。原作者改了吗?
    changepc90
        2
    changepc90  
       2020-11-19 15:05:32 +08:00
    asic -> fpga -> gpu -> cpu,灵活性上升,性能下降,这个是业内常识了。
    灵活性和性能是很难两全的,对于使用场景明确的场合,可以放弃灵活性。
    apple 有这个条件,它是能设计使用场景的。
    文章中提及的技术目前 Intel AMD NV ( ARM)三家厂商都或多或少使用过,不过 M1 先试水获得不错得反响之后,其它厂商会更愿意推进。但是这对软件生态而言是个挺大的挑战,厂商最好能尽可能协调,构建一个通用的框架。

    ( IBM power 每代演进时,也是塞新的模块进去,比如 power9 有特殊硬件电路能加速 deflate 、inflate 计算,跑得飞快。)
    quiet1991
        3
    quiet1991  
       2020-11-19 15:09:15 +08:00
    这个思路好像计算机早期发展的时候,就有这么搞过的,特别是工业芯片,就是专片专用,也不是啥新思路。

    我个人觉得,应该是因为最近计算机界发展到瓶颈了,迭代慢了,上升曲线没那么陡峭了,这样搞才有一定的市场吧。
    vsitebon
        4
    vsitebon  
       2020-11-19 15:13:23 +08:00
    @lvybupt 应该是被改了或者是楼主自己的想法
    makecloud
        5
    makecloud  
       2020-11-19 15:14:10 +08:00
    参考下手机也是 Soc 不能换内存,怎么发展的比电脑如此迅猛呢?分析的这么底层,就脱离实际了,没意义。
    qq316107934
        6
    qq316107934  
       2020-11-19 15:16:46 +08:00
    按照这个解析,将要出的 H.266 以及未来的 H.267 是不是 M1 编解码性能就不如 CPU 了,然后苹果推出 M2/M3 催着换代再赚一笔?计划通
    lly0514
        7
    lly0514  
       2020-11-19 15:31:12 +08:00   ❤️ 15
    都说通用计算 M1 被暴打,但是这两天各种场景的测试,无论是跑分还是压视频还是编译软件还是打游戏,M1 都没被暴打,到底什么是通用计算?
    Hoshinokozo
        8
    Hoshinokozo  
    OP
       2020-11-19 15:32:09 +08:00
    @lvybupt 参见里面的另一篇文章:超宽的架构对于 x86 是否可行?
    Hoshinokozo
        9
    Hoshinokozo  
    OP
       2020-11-19 15:33:21 +08:00
    @lly0514 服务器,科学计算,工业软件领域吧
    lly0514
        10
    lly0514  
       2020-11-19 15:37:01 +08:00
    @Hoshinokozo 深度学习性能接近 1080,也没被暴打。。服务器的话,编译软件已经说明问题了。作为个人电脑已经找不到 M1 弱点了
    Hoshinokozo
        11
    Hoshinokozo  
    OP
       2020-11-19 15:37:38 +08:00
    @qq316107934 这倒不至于,题主说了,即使用 CPU 软解,M1 的单核性能也足够强大,只是没有现在这么夸张的表现,现在各种视频处理吊打 i9,应该是加速单元起了很大的作用
    Hoshinokozo
        12
    Hoshinokozo  
    OP
       2020-11-19 15:41:02 +08:00
    @lly0514 你也说了,作为“个人电脑”,但是 X86 服务的可不只是个人电脑
    bookit
        13
    bookit  
       2020-11-19 15:41:52 +08:00
    @lly0514 比如压缩它不支持的视频格式,或者加几个 lut 。
    lvybupt
        14
    lvybupt  
       2020-11-19 15:45:42 +08:00
    @Hoshinokozo 也没有看到。 其实 Intel 和 AMD 也内嵌了各种不同的逻辑单元的。比如上面评论里的 H.265 的硬解。
    我觉得苹果凭借它软件上的优势,分析统计出来用户对不同计算类型的需求占比,有针对性的制造硬件,这个是一定的。 类似 nv 和游戏商的合作。amd 一直堆算力是超过 nv 的,游戏效果反而各有胜负。
    lly0514
        15
    lly0514  
       2020-11-19 15:51:40 +08:00   ❤️ 1
    @Hoshinokozo 还是得找一个场景量化证明 M1 露馅,目前还没有
    wangpao
        16
    wangpao  
       2020-11-19 15:51:54 +08:00 via iPhone
    @Hoshinokozo 这就不是消费市场产品要首要考虑的了
    lly0514
        17
    lly0514  
       2020-11-19 15:52:01 +08:00
    @bookit 目前有这方面测试了吗?
    Hoshinokozo
        18
    Hoshinokozo  
    OP
       2020-11-19 15:52:49 +08:00
    @lvybupt 那么同样的晶体管资源,与其用来实现超宽架构,不如用来多做两个核心。因为一些复杂计算,往往是后续的计算步骤需要等待前面指令的计算结果才能进行下去,一旦碰到这种情况,超流水线、乱序执行机制无效,再宽的架构同一个时钟周期也只能执行一条指令。如果是大量结果无关可以并行的指令,往往同时又是适合 SIMD 指令发挥的时候——前提是数据结构优化好了。

    从这句话就能看得出来了
    Hoshinokozo
        19
    Hoshinokozo  
    OP
       2020-11-19 15:55:27 +08:00
    @wangpao 我转这篇文章的目的只是为了让大家更理性的看待 M1 而已
    wangpao
        20
    wangpao  
       2020-11-19 15:58:24 +08:00 via iPhone
    @Hoshinokozo 没有要引战的意思,请不要误解
    Hellert
        21
    Hellert  
       2020-11-19 16:04:28 +08:00
    用就得了,Apple 那帮人又不是傻子,能考虑的肯定考虑到了。
    AugOmin
        22
    AugOmin  
       2020-11-19 16:08:17 +08:00
    通用场景就 4800u 的水平吧,考虑价格和一些场景的专用芯片加持,Apple 这次显得特别有性价比,不过 16g 还是太少了
    kop1989
        23
    kop1989  
       2020-11-19 16:08:17 +08:00
    所以我很好奇 M1,或者说苹果目前的技术水平下,ARM 架构 Soc 的上限在哪里。(下限已经很明确了,下限很高,很厉害。)

    如果按照文章和 lz 的解读,理论上讲苹果 ARM 架构 Soc 的上限至少目前架构下不是很高。而且因为各种专用芯片(或者说专用设计)是否会导致芯片疲于追逐标准,导致只能覆盖中低端产品线的情况。
    byte10
        24
    byte10  
       2020-11-19 16:09:01 +08:00
    @lly0514 哈哈,没办法,那些人基本常识都没有,M1 能高效运行 90%的应用满足 99%的人(普通工作者,非卫星开发工作者),剩下不满足的等 arm 原生开发应用把。
    Hoshinokozo
        25
    Hoshinokozo  
    OP
       2020-11-19 16:11:11 +08:00
    @wangpao 其实这也算是苹果的一种策略吧,或者说 MAC 的定位本身就是“消费级个人电脑”,但是 X86 要服务的不仅是消费领域,各种企业,实验室,设计院,数据中心,X86 要面对的环境比 ARM 复杂得多,这就导致 X86 不得不采用 CISC 的原因吧。ARM 没有这方面的顾虑,所以可以消耗大量晶体管做出 IPC 爆表的超宽架构,和各种协处理器。所以叫嚣 ARM 吊打 X86 实际上有点关公战秦琼了,当然,这不是 Intel 年年挤牙膏的理由,要不是 AMD 和苹果,天知道 Intel 这几年划了多少水
    lly0514
        26
    lly0514  
       2020-11-19 16:16:30 +08:00
    @byte10 是啊,感觉他们的意思是 M1 芯片在某个地方不行(包括洗衣机,F22 战斗机,到数据机房),所以 M1 还暂时不能用作专业用处
    agagega
        27
    agagega  
       2020-11-19 16:17:43 +08:00 via iPhone
    X86 继续 CISC 是因为它一开始就是 CISC,这个兼容性必须维持呀,就像 Windows 。

    至于 CISC 和 RISC 的区别,指令集上都不是那么明显了. ARM 和 POWER 也都有很多专用指令了(不过 ISA 文档还是比 X86 短不少,哈哈)

    单纯从汇编的角度来看,RISC 好像更优雅一些
    Hoshinokozo
        28
    Hoshinokozo  
    OP
       2020-11-19 16:21:53 +08:00
    @kop1989 作者一开始就写的很清楚了:“整体的力量:SoC 、统一内存,以及操作系统优化”,这三个缺一不可,同样是 ARM 架构,高通和 ARM 公版不是照样年年被 A 系列吊打,所以与其说是 ARM 的胜利,不如说是苹果的胜利,M1 的出现让人们看见了整合了软硬件生态的企业究竟有多恐怖,这也是我对 Intel 仍然有信心的原因。相比台积电代工,采用自家工艺的 Intel 肯定还是更好的。
    shyling
        29
    shyling  
       2020-11-19 16:22:34 +08:00
    x86 是历史原因,不存在不得不采用 CISC 。
    另外世界上哪里存在通用场景。。专用场景肯定专用芯片才是最佳解决方案,还考虑什么通用解决方案的只是自身的差距吧
    geekzhu
        30
    geekzhu  
       2020-11-19 16:26:13 +08:00
    目前就等着看下一代能支持多大内存了
    icyalala
        31
    icyalala  
       2020-11-19 16:27:02 +08:00
    大概明白 LZ 想说的是什么了。。
    楼主觉得执行单元多、流水线宽,在指令 ILP 高的情况下性能会更好,但是 ILP 低的时候就会浪费,不如用相同资源实现多核或者开 SMT 。问题在于对于个人设备来说,ILP 提升当然比 TLP 更重要。

    另一个相反的例子就是 Power 系列,执行单元多流水线也宽,人家单核能开 SMT8,但它用在什么地方,你不能这是"通用计算场景"吧。。
    shyling
        32
    shyling  
       2020-11-19 16:28:58 +08:00
    另外说实话 m1 明显是个人桌面市场的布局,大小核为了功耗,arm 为了与 iOS/iPad OS 整合。。。跑去跟 Xeon 之流比多核性能,你咋不把 5950x 放笔记本上比跑 iOS 应用时的功耗呢- -
    lvybupt
        33
    lvybupt  
       2020-11-19 16:32:23 +08:00   ❤️ 6
    #25 你这一条不太能同意。
    理性探讨。 我是从事科研工作的,就我接触的领域,实验室,设计院,这个过程恰好是去 x86 化的。x86 的 pc 只在人员办公和仿真阶段。 越专业的事情交给越专业的硬件做,通用型计算恰好更适合在个人电脑这个层面。 在产品端,x86 架构的设备更多的也是用来驱动各种各样的“专业卡”,这也是一种折中的妥协,有很大的投入就是去掉 x86,甚至我们希望单片机+专业卡来完成任务是理想状态,服务器端更是不允许依赖 x86 。
    bookit
        34
    bookit  
       2020-11-19 16:37:38 +08:00
    shyling
        35
    shyling  
       2020-11-19 16:38:35 +08:00
    超宽执行架构是的 M1 的每个核心晶体管消耗量远大于 X86,加上各种专用单元,8 核的 M1 就已经堆了 16B 的晶体管,即使是 5nm 也快到极限了,所以 M1 架构堆核的成本远高于 X86,在遇到吃多核性能,且 M1 的各种加速单元都不顶用的通用计算场景时,会被多核 X86 暴打( AMD YES )

    另外这段是你自己加的吧,先考虑一个前提情况:**因为这些计算通用,所以才会有专用的单元**,配合上面一条回复,针对个人桌面市场,一台笔记本用几年的时间,并不会发生**近期出来的 h.266 几年内成为行业主流的情况,m1 分分钟过时**。

    暴打就更不可能了,参考原文 [不过以 M1 的超宽架构带来的强悍 IPC,大概率也不会比别家差就是了。]
    Hoshinokozo
        36
    Hoshinokozo  
    OP
       2020-11-19 16:52:43 +08:00
    @shyling 这段确实是我自己理解的,不过我说的 M1 会被多核 X86 暴打说的是多核性能,M18 和就已经 16B 的晶体管了,5950X 才 8B,所以说 M1 相当于是放弃了多核性能,把大量晶体管用于提升 IPC 了
    Hoshinokozo
        37
    Hoshinokozo  
    OP
       2020-11-19 16:53:06 +08:00
    8 核
    MrKrabs
        38
    MrKrabs  
       2020-11-19 16:54:50 +08:00
    还通用场景,也没见哪里特别拉垮了,起码先实测个再来说吧
    nguoidiqua
        39
    nguoidiqua  
       2020-11-19 16:55:36 +08:00   ❤️ 1
    凡是需要高性能的场景现在大都专用化了,比如游戏、图形图像、AI 。

    经济的发展趋势就是分工化专业化,技术的发展难道能不遵循经济的规律?包括那些所谓的通用计算更强的处理器架构,不也在各种增加专用指令集?

    一直都是这个趋势,苹果只是更步子大了点。
    jjfjjmldhz
        40
    jjfjjmldhz  
       2020-11-19 16:56:32 +08:00
    现在大部分人的笔记本也不能流畅剪 h.265 啊,这和不支持 h.266 的 m1 区别是?
    Hoshinokozo
        41
    Hoshinokozo  
    OP
       2020-11-19 16:56:33 +08:00
    @lvybupt 哈哈,这只是我个人的推测,见谅
    shyling
        42
    shyling  
       2020-11-19 16:57:45 +08:00
    @Hoshinokozo emmmm m1 是 soc,各种专用核,ram,firestorm, icestorm 总共 16B,5950X 应该也是带其他内容。我觉得比较的话应该不能直接比总共的晶体管数量。
    denvi
        43
    denvi  
       2020-11-19 16:58:49 +08:00 via iPhone
    答主大概是两个意思,一是苹果和 AMD 都是舍弃了部分功能来达到能和 intel 掰手腕的水平。二是 arm 要在高性能上跟 x86 打,代价不见得比 x86 少,且能不能拉上去还不知道。
    我觉得吧,intel 面对的市场太广泛太长尾,兼顾起来就是这个卵样,而且某些领域利润率是高,但芯片大概已经是出货量为王的行业了。门槛迟早被别家踢开。
    像苹果和 AMD 的取舍不是被证明了是正确的路线嘛?摩尔定律的逐渐失效,根据特定市场、应用去“定制”,性能-成本的曲线才是最优的。这恰恰是 x86 历史原因比 arm 要难的。君不见 intel 为了性( pao )能( fen )搞出来的 avx512 被业界多少人骂…连多个版本跑分软件都把这块踢出去…
    Hoshinokozo
        44
    Hoshinokozo  
    OP
       2020-11-19 17:00:46 +08:00
    @nguoidiqua 未来或许是吧,但是现在 X86 依然是主流,而且最近只是因为 Intel 拉胯了才导致大家怨气集中爆发,实际上 X86 本身并不弱
    Hoshinokozo
        45
    Hoshinokozo  
    OP
       2020-11-19 17:02:51 +08:00
    @denvi 哈哈,还是老哥你总结的到位。
    wanguorui123
        46
    wanguorui123  
       2020-11-19 17:06:01 +08:00
    @qq316107934
    我猜测:
    1 、当编码升级到 H256/H267,软解 VS 软解,英特尔的 U 照样打不过
    2 、苹果的各个专用单元,在苹果的生态下是通用的,只是如何集成到 SOC 上需要重新设计电路,这叫高内聚低耦合
    3 、说苹果 16G 内存是上限,其实我认为可以加长 SOC 的 PCB 版扩充内存,或者额外的插槽扩展相对低速率的内存,通过操作系统 分级缓存的策略 来保证运行效率
    denvi
        47
    denvi  
       2020-11-19 17:06:38 +08:00 via iPhone
    @shyling 那位答主另外一个回答好像也提到了单位晶体管性能,这典型是被技术 /参数遮蔽了,arm 的商业模式跟 x86 的生态就不一样,跟苹果或者未来会上 arm 桌面端芯片的其他厂比,要比的是同整机价格下的性能啊。真要比可能就只有高通一家适合按单位晶体管性能来比?
    苹果 A 系列芯吊打其他手机厂商,不是靠这种不大需求计较成本的“堆料”赢的嘛?只是在电脑端又来一遍而已
    Hoshinokozo
        48
    Hoshinokozo  
    OP
       2020-11-19 17:08:33 +08:00
    @shyling 5950 也是 SOC 呀,内存控制器,还有 APU 的集成显卡,你没明白我的意思吗,M1 把大量晶体管用于这各种定制电路和提升 IPC 了,这就导致同样的晶体管规模核心数是不及 X86 的,而且想堆核心也是比较困难的,所以在纯频 CPU 性能的场景,M1 固然单核很强,可架不住人家 X86(AMD)核多啊。
    nguoidiqua
        49
    nguoidiqua  
       2020-11-19 17:09:18 +08:00   ❤️ 1
    @Hoshinokozo

    这其实不是 X86 主流还是 ARM 主流的问题,也不是 X86 弱不弱的问题。

    这是通用计算和专用计算哪个会成为未来主流的问题,是通用计算和专用计算哪个更能满足消费者需求的问题。

    我想现在大家可以看到答案了,X86 处理器要继续发展,必然也得这么搞。
    casioyan
        50
    casioyan  
       2020-11-19 17:11:32 +08:00 via Android
    @kop1989 如果只是说 Arm 架构的上限(非苹果这种面向消费级),可以看看目前超算第一,日本的富岳。
    reus
        51
    reus  
       2020-11-19 17:11:41 +08:00
    @shyling 一个 zen3 CCX 是 40 亿晶体管,只有 cpu 核心和缓存,没有其他内容。5950X 是两个 CCX,所以算 80 亿。但实际上 80 亿是不带 IO 部分的,加上的话就不止 80 亿了。
    cherryas
        52
    cherryas  
       2020-11-19 17:16:50 +08:00
    M1 最大缺点就是扩展差。不支持独立显卡,不支持扩展内存。
    Hoshinokozo
        53
    Hoshinokozo  
    OP
       2020-11-19 17:18:15 +08:00
    @nguoidiqua 这个我就不得而知了,不过现在 ARM MAC 还是很多事情干不了,别的不说,打游戏这种贴近生活的场景就没辙了,X86 慢是慢了点,带好歹能玩呀
    reus
        54
    reus  
       2020-11-19 17:20:30 +08:00
    AMD 最近收购了 xilinx,就是搞 fpga 的公司,然后 AMD 抛出了一个很有意思的东西:
    https://www.phoronix.com/scan.php?page=news_item&px=AMD-ROCm-Xilinx
    “Ultimately they aim to provide a fully integrated ROCm runtime to span from AMD CPUs and GPUs through FPGAs. ”
    如果真的在 CPU 或者 GPU 里嵌入 fpga 核心,可以让用户自己编程,那就解决了前面提出的 h266 的问题了。
    需要 h266,那就自己写入到 fpga 核心里,获得更快的速度。出了 h267,还可以继续升级。
    我觉得内嵌 fpga 是比写死专用算法更好的选择。
    denvi
        55
    denvi  
       2020-11-19 17:25:36 +08:00 via iPhone
    @nguoidiqua 这个得看领域,在绝大部份生产力和娱乐应用中,专用芯片早就是共识了。但在科研等对性能和灵活同时有极高要求的,“少两片专用芯片,多造万能的 cpu”确实是对的。不过这实在是有点搞笑的理论…
    担心生产力和娱乐领域的算法、标准有变,导致专用芯片的的废了,不知道前者的变革快还是设备更新换代的周期快呢…
    担心整片 Soc 里有些专用芯片用不上,浪费了晶体管…这就是市场取舍的因素了,跟 arm x86 没多大关系。那位答主觉得浪费,可恰恰覆盖到了大部分目标消费者的需求,而且综合成本可能还更低…
    nguoidiqua
        56
    nguoidiqua  
       2020-11-19 17:27:08 +08:00
    @Hoshinokozo

    搞笑,X86 离开了显卡能玩毛啊?玩游戏还不都是看显卡的,你用你的通用多核跑得起吗?

    把你晶体管全堆在 CPU 多核上面嘛,用什么显卡,这种专用计算最浪费晶体管了,把显卡的晶体管也拿来堆 CPU 多核,通用计算最好了,多核跑分最高了。
    shyling
        57
    shyling  
       2020-11-19 17:28:13 +08:00
    @Hoshinokozo 其实我觉得强弱不在于指令集。

    你看看知乎那个回答,也没谈什么指令集。

    m1 最令人惊艳的是 apple 凭借自身基础把以往 pc 上零散的组件集成化的能力以及软件上的实力。

    这种同时需要软硬件实力才能做的事情,可能也就微软,苹果能做吧。可惜上次微软失败了,苹果看上去成功了很多。

    记得以前写个 cuda 程序,数据在内存和显存来回复制,大部分时间都花在复制的路上,现在看看 m1 这种统一内存的设计不要太香,但你想想传统 pc 上怎么实现这个,联合 intel + amd + 主板厂商 + 内存厂商 + 老黄吗,是不是难了一些 hhh
    wanguorui123
        58
    wanguorui123  
       2020-11-19 17:31:49 +08:00
    @reus
    我赞同 @denvi 的观点,CUDA 和 FPGA 这类可编程的高性能计算实际上,在科研方面有优势。
    民用和商用专用芯片更有价值,而且成本更低。

    如果真正需要灵活性,单独购买 FPGA 与 CUDA 这类可编程的加速卡就完了。
    rubin01
        59
    rubin01  
       2020-11-19 17:32:47 +08:00
    @Hoshinokozo 关键是 intel 的 mac 也玩不了游戏 233
    casioyan
        60
    casioyan  
       2020-11-19 17:32:53 +08:00 via Android
    @Hoshinokozo AMD 虽然核多,但是日常出货 5950x 也不是主力。。。之前在讨论问题就是 M1 的短板在哪?就我个人的感觉,在 PC 领域,日常的文件处理,影音娱乐,以及程序员需要的编译性能,影音工作者需要的视频编解码,AI 工程师的炼丹。如此多的通用领域,M1 都可以带来无敌的能耗续航和这样的使用体验,是否可以认为是没有短板了?

    让专业的人做专业的事,高性能计算领域已经证实,专有架构更容易针对特殊应用进行优化。神威太湖空载率那么高还是因为国内基本只用 X86 架构的软件,并没有那么大的动力去针对性编写代码。

    当然,这扯远了。我想说的是单纯的对某种架构进行 scale up 并没有意义。。。
    nguoidiqua
        61
    nguoidiqua  
       2020-11-19 17:35:07 +08:00
    @Hoshinokozo

    随便告诉你吧,Windows 可是也出过 ARM 笔记本的,Surface Pro X,玩游戏可是强过那些没有独显的 X86 笔记本的,你不要看苹果现在没出独显的就在这跳得起。

    Switch 可是 ARM 的处理器,手机游戏大多也是运行在 ARM 处理器上,游戏比 X86 多多了,玩家也多多了,打游戏没辙?搞笑吧。
    denvi
        62
    denvi  
       2020-11-19 17:39:10 +08:00 via iPhone
    @kop1989 上限?简单理解跟 x86 一样啊,跟是 arm 还是 x86 关系不大。从苹果 M1 这次微架构的解析来看,空间大的是,看苹果怎么在功能、功耗上取舍而已。微架构的设计能力跟 intel 和 AMD 至少在同一个级别了。
    intel 在工艺拉垮、功能不太愿意割舍、没有所谓软硬结合的优势下,还能有现在的性能,其实算是体面了吧…科技树点歪了些,现在有作业可抄,工艺貌似又行了,未来还有大战呢
    Hoshinokozo
        63
    Hoshinokozo  
    OP
       2020-11-19 17:44:04 +08:00
    @casioyan 道理是这样的。。。作者是想通过多核性能来说明 M1 架构设计的优缺点,不过事实证明 M1 这种设计确实已经涵盖大部分场景了,M1 的成功不仅是架构吧,苹果自家的 OS 也功不可没,说白了还是软硬件结合的好,就不知道 AMD 和 Intel 看了之后会去如何改造 X86 了。Intel12 代要上大小核,这是开始学 ARM 了,AMD 好像不太看好,作为吃瓜群众,以后的瓜越来越多,这是好事(手动狗头)。
    Hoshinokozo
        64
    Hoshinokozo  
    OP
       2020-11-19 17:46:38 +08:00
    @nguoidiqua 显卡那也是搭配 X86 啊,还是说你真想用 M1 的集显玩古墓丽?
    nguoidiqua
        65
    nguoidiqua  
       2020-11-19 17:48:43 +08:00
    没事扯晶体管数量,那 80 亿晶体管的处理器是功耗更低还是成本更低了。

    说别人浪费,你还浪费电呢。
    Hoshinokozo
        66
    Hoshinokozo  
    OP
       2020-11-19 17:48:44 +08:00
    @nguoidiqua "不过现在 ARM MAC 还是很多事情干不了",注意我的前提,苹果出独显我当然喜闻乐见,然而和现在有什么关系吗?
    denvi
        67
    denvi  
       2020-11-19 17:54:49 +08:00 via iPhone
    谁提到了 FPGA ?这个东西感觉有点像 3D 打印机一样…对消费级和大部分所谓生产力市场来说根本没卵用,可用范围太窄了,而且绝不是现在我们看到各种专用芯片的用途。虽然当年 iPhone 7 吧第一次放在了手机里,至今我都没搞懂干嘛用,后面的型号还有没有放
    Kupanda82
        68
    Kupanda82  
       2020-11-19 17:56:15 +08:00
    m1 超宽架构,600+ROB,整数 ipc 没啥缺点,浮点也不差, 唯一差的就是扩展性, 只给 2 个雷电口, 内存只有 16G 。要是给 4 个雷电口,内存上 64G,再支持独显,上 16mbp 就完美了
    yzbythesea
        69
    yzbythesea  
       2020-11-19 18:00:26 +08:00
    FPGA 编译效率低,而且特别昂贵。拜托别太民科了。
    lizytalk
        70
    lizytalk  
       2020-11-19 18:02:12 +08:00 via iPhone
    @Hoshinokozo 不过苹果本来也就没准备涉足服务器芯片领域吧。人家就是卖 Mac 的
    nguoidiqua
        71
    nguoidiqua  
       2020-11-19 18:02:12 +08:00
    @Hoshinokozo

    你还用显卡啊,我以为你用通用计算玩游戏呢。显卡晶体管那么多,浪费哦,不如堆 X86 多核。

    先说 ARM 没游戏玩,发现不对了就说 ARM 没得独显搭配,但再过半年苹果就会出带独显的机子,你到时候又怎么说——你会说 macOS 游戏少。

    这些跟你说的晶体管堆多核更好有什么关系?扯这些能证明 M1 晶体管浪费了?
    shyling
        72
    shyling  
       2020-11-19 18:07:12 +08:00
    @Hoshinokozo 我觉得你有种假设是 x86 和 arm 能做到的面积是一样的,但是明显不是这样的,A 系列 U 这几年相对骁龙最大的特点是不就是能堆料嘛,我做的比你大,能装的晶体管也就越多。而且相对 x86 系列,apple 不怎么受主板 CPU 接口的限制,毕竟都是自己产的
    reus
        73
    reus  
       2020-11-19 18:08:17 +08:00
    @shyling AMD 的 APU 早在 2013 年就是和 cpu 统一寻址的了: https://www.tomshardware.com/news/AMD-HSA-hUMA-APU,22324.html
    Intel 带 GPU 的处理器也是,从 7 代起就是统一寻址的,不需要复制。
    很老的技术了,不是 M1 首创的。
    nguoidiqua
        74
    nguoidiqua  
       2020-11-19 18:09:48 +08:00
    @Hoshinokozo

    现在干不了吗?现在不能玩 iPhone 游戏吗?没辙吗?对不起,可玩的游戏多了很多好吧,倒是 X86 的 Mac 只能望洋兴叹了。

    而且原本的 Mac 游戏也都能跑啊,效果也都更好啊?你不知道吗? M1 的显卡超过了原本 90% 的 Mac,因为 90% 的 Mac 都是无独显的机型,无论 CPU 还是 GPU 都不如 M1 三剑客,即使是转换损失性能的情况下,M1 依然强过它们。
    Hoshinokozo
        75
    Hoshinokozo  
    OP
       2020-11-19 18:10:31 +08:00
    @shyling 这个主要是跟工艺有关系吧,个人猜测,按照台积电给的 PPT,5nm 工艺相比 7nm 能做到 80%晶体管密度提升,差不多就是 M1 和 5950 的差距了
    winglight2016
        76
    winglight2016  
       2020-11-19 18:12:04 +08:00   ❤️ 1
    lz 其他的观点我觉得是有道理的,但是你对 x86 有信心,不能再说对 intel 有信心了呀,现在 intel 已经被 amd 吊打了。。。而且这个差距很明显不是一年半载能追得回来的
    shyling
        77
    shyling  
       2020-11-19 18:13:08 +08:00
    @reus 问题是没用过 apu / intel 集显做过 ml 相关啊(说实话我怀疑性能
    shyling
        78
    shyling  
       2020-11-19 18:17:58 +08:00
    @nguoidiqua 这么想想除了 mac 装 windows,arm mac 比 x86 mac 好多了^_^
    reus
        79
    reus  
       2020-11-19 18:25:59 +08:00
    @shyling 集成显卡性能是低的,所以即使统一寻址,也比不上需要复制到显存处理的独立显卡。我只是想说统一寻址不是 M1 首创,原本就有这样的架构,手机 soc 也全都是 cpu 、gpu 统一寻址的。
    denvi
        80
    denvi  
       2020-11-19 18:26:29 +08:00 via iPhone
    @winglight2016 别想当然,intel 只是躺惯了,只要这次 10nm 真能大规模出货了,不要说 7nm,即使用上 5nm 的 zen3 都有得一打。intel 的设计能力还是妥妥的第一,输的可能性只存在于自家 fab 出货量跟台积电完全没法比,工艺的差距很容易越拉越大。希望被打醒的 intel 能想办法克服工艺无论技术还是商业策略的困难。
    seansong
        81
    seansong  
       2020-11-19 18:30:00 +08:00
    手头 M1 版本的 air 使用了一天多了,定制了 16G 内存,本人互联网行业产品狗,偶尔写个代码,也画个图,从这一天多的使用体验来看,相比我之前老款的那台 air @ 2019,几乎所有的操作,都有肉眼可见的性能提升,暂未遇到任何不兼容的软件,vs code 运行非常正常且很快,行数多的文件打开,滚动的时候丝般顺滑,比之前 intel 强很多。我这两天的使用,场景应该已经涵盖了一般人大部分的日常场景了(当然特殊情况肯定还是存在的),性能提升、续航提升和兼容性,真香,这种提升程度让我非常期待 16 寸 pro 发布

    我在 air 上尝试用第三方软件压制了一些 HEVC 视频,这些软件并没有官方适配 M1,但是速度也比 intel 版本集显快了大概 1 倍,我想如果这些软件适配了 M1,估计性能还可以有比较大的提升吧,个人猜的,对这块不太懂
    hyq
        82
    hyq  
       2020-11-19 18:33:10 +08:00
    苹果根本就没有放弃扩展性,扩展性这个东西对于苹果来说一直都是不存在的。老版的 macbook (不包括最古老的那种)能升级内存?能升级 cpu,能升级硬盘?既然一直都没有扩展性,那对于苹果来说就是没有任何牺牲。
    denvi
        83
    denvi  
       2020-11-19 18:36:10 +08:00 via iPhone
    @lvybupt 有益的回复👍
    Hoshinokozo
        84
    Hoshinokozo  
    OP
       2020-11-19 18:39:06 +08:00 via Android
    @denvi 非常赞同,还有一点,台积电的工艺也是比较标准化的,或者说很难优化的,而且台积电的工艺主要是针对低功耗处理器的,频率很难拉高,看 zen3 用了改良版 7nm 还是很难突破 5Ghz 就知道了。对比之下,Intel 的 14nm 经过不断改良,已经飙到 5.3Ghz 了,足以证明同时掌握 CPU 设计与制造是极具优势的。
    denvi
        85
    denvi  
       2020-11-19 18:45:30 +08:00 via iPhone   ❤️ 2
    @Hoshinokozo 只能说 fab 模式在这个时代更不好走。我认为一大部分原因是 ARM 公司这个妖孽,开放授权的商业模式,设计和生产两端都是开放的,这造就了多少 arm 的玩家…芯片又是个芯片改良-出货-升级 循环最为重要的行业,各种因素加起来也培育了台积电这头巨兽,即使 intel 不躺这几年也会很难受的
    cosss
        86
    cosss  
       2020-11-19 20:32:04 +08:00
    @denvi #81 赞。比起苹果秒天秒地的吹法,我觉得这带来的更多的 arm 玩家是未来更值得期待的
    x86 只有 ia 能玩,放在当下来看,是更有可能被相对更开放的 arm 干掉的
    shayuvpn0001
        87
    shayuvpn0001  
       2020-11-19 20:45:08 +08:00
    @denvi 台积电不是只靠 ARM 玩家们的订单的,还有 nvidia 和 AMD 的 GPU,Xilinx 的 FPGA 。
    ThinkMan
        88
    ThinkMan  
       2020-11-19 20:50:13 +08:00 via iPhone
    M1 后,那就不能装 windows 和 linux 了吧
    systemcall
        89
    systemcall  
       2020-11-19 20:50:21 +08:00   ❤️ 6
    Intel 的 CPU 上面也有很多专用的电路,甚至没有核显的部分型号实际上还是有 iGPU,我觉得这种东西才是浪费
    说到播放视频,现在主流的方案都是硬解,没有 iGPU 的机子是靠的显卡里面的 Decode 电路,一般也就解个 4k60 HEVC 10bit,如果是笔记本这样有 iGPU 的话都是 CPU 里面的专用单元在解码,Core 部分基本上不怎么动。软解的话如果限制功耗,X86 还真的不一定能有 M1 的性能,看 Benchmark 就行了,这种场景实际和 benchmark 是差不多的
    成本的话,只要对 Apple 来说便宜就行了。一套东西可以通吃手机、笔电、iPad,甚至还可以修改后放到 iot 设备、蓝牙耳机、可穿戴设备之类的地方,这就是 cost down
    片上内存这点,现在是初代,以后如果堆多点完全没问题。这又不是 HBM,只是放到一个封装而已,我认为是内存控制器设计的问题,还有产品的定位的原因。要扩大内存的话并不难做,HBM 都可以在 Die 周围放 4 颗。至于没法单独更换,其实现在主流的轻薄本也是不支持更换内存的,焊在主板上和放在 CPU 封装里对用户是一样的,对苹果这种体量很大的厂家也是一样的
    使用了当前硬件不受支持的算法的话确实要更换新的硬件。不说别的,你的显卡可以解 H.266 吗?台式机才可以换显卡,笔记本现在几乎全都是焊死的了。而 AMD RX6000 的新功能也需要新的平台才可以支持
    还有,AMD Zen 开始也是有非常多的专用的单元,在此之前 Intel 也搞了个 ME 。对用户来说都是不可控的,这才是最大的问题。不过都这样了,也就不是问题了
    zhangdawei
        90
    zhangdawei  
       2020-11-19 21:10:33 +08:00
    场景限定的很死了,
    denvi
        91
    denvi  
       2020-11-19 21:22:42 +08:00 via iPhone
    @shayuvpn0001 嗯?你再看看我的表述?
    订单只是表象罢了,真要聊台积电,那是现在相当一部分号称做硬科技投资的机构入门题,很多投资人认为这个星球上只有 fabless 走得通。我给你几个方向思考,产业、技术、国际经济、地缘政治。
    大部分人只会争论参数性能胜负什么的,真正影响行业发展的却少有人关注。不过,论坛吹吹水挺好的
    Zzzzzzzzzzz
        92
    Zzzzzzzzzzz  
       2020-11-19 21:39:38 +08:00
    第一条和第三条都不成立,在多核上 m1 都能和 4800u 有来有回,哪里来暴打的情况。第三条对所有 CPU 都成立,当应用新的算法时候,没有硬件加速,软解谁不是看 CPU 性能?
    GrayXu
        93
    GrayXu  
       2020-11-19 22:09:03 +08:00
    @denvi FPGA 贵的一批
    denvi
        94
    denvi  
       2020-11-19 22:28:43 +08:00 via iPhone
    @GrayXu 用途都不对,FPGA 更多用在数据中心啊
    pjntt
        95
    pjntt  
       2020-11-19 22:47:00 +08:00
    用长尾来说,Inter AMD 的设计是为了满足整条长尾需求,苹果的 M1 设计是为了满足长尾开头那一部份需求。目前也只有苹果能把软硬一体才搞出了这个效果,换别家还真不行,且折腾呢。
    shuaiyuan
        96
    shuaiyuan  
       2020-11-19 23:01:06 +08:00   ❤️ 1
    个人电脑专片专用,抛弃使用不到的场景就是好硬件。
    Felldeadbird
        97
    Felldeadbird  
       2020-11-19 23:03:08 +08:00
    就算有新算法出来,普及也是一个时间吧。以苹果目前的能力,将 mac 一年一更新也不是大问题。等到市场差不多了,在新 U 先补上,不告诉你们。等新品发布了,在说上一代已经支持,精准的刀法啊
    sujin190
        98
    sujin190  
       2020-11-19 23:43:11 +08:00
    其实也不用纠结,不管怎么说 apple 在 M1 把内存集成在一起,然后又增加专用协处理器的方案在个人消费品领域肯定是走对了,反正苹果几乎用途都是个人消费品领域,既然如此那么这个方案妥妥的就是好方案啊,但是如果说仅此就说要吊打 x86,似乎就有点杞人忧天了,一个是功耗敏感延时敏感但通用性不敏感可管理性不敏感,一个则是性能不低又要易于迭代替换大集群管理但对功耗倾向不敏感,这两场景本来也没啥可比性吧

    我们感觉消费品领域最火但是可能也是接近因为太我们,认真看其实是一个市场很大但是场景很窄,其实 intel 和 amd 想做个类似方案也不难,apple 这次怎么看都是一个方案创新而不是技术革新,完全得益于自己的生态特点,能否取代 x86 地位还未可知,毕竟计算机网络系统肯定要几何级发展的,想想十年前百万主机数据中心何种量级,那么看也许十年二十年后就是亿更甚者十亿为单位了,未来肯定是要算法和数据价值持续上升能源成本持续下降了
    denvi
        99
    denvi  
       2020-11-19 23:50:29 +08:00 via iPhone
    @sujin190 再来吹一波苹果洗洗睡
    传统 PC 主板的 CPU GPU 内存 IO 主控等高度模块化的分离设计,因为厂商各立山头是没办法做到像苹果一样,将所有算力单元集成在一个 Soc 里面,并且把各个数据格式统一、通过统一内存来流转。

    上面任何一个理念单独看都并不新鲜,但组合在一起就是苹果式的改变世界。这在 PC 端真的是开天辟地。

    集成 Soc 的优缺点这先不说了,我在意的是未来电子设备设计的新范式。虽然在手机端已然在实践,但今天放在 PC 端才更显现出来:

    电子设备可抽象为几大模块,电源、IO 、储存和算力,算力模块从 CPU GPU 发展到现在的 NPU 和各种专用芯片,M1 的 Soc 化使得各算力单元在物理上真正组合成一个“模块”。

    实际应用的算力请求将有一个统一的去处,通过操作系统和调度单元的分析,将应用的算力请求拆分成不同的任务,调度到不同的专用芯片处理,多芯片协作、专芯专用、数据 /时效统一,再将计算结果输出。

    这简直有种统一、优雅之美啊。

    未来从系统、应用、数据到芯片设计,遵循这种新范式将成为趋势。
    kingcos
        100
    kingcos  
       2020-11-19 23:51:21 +08:00 via iPhone
    特别专业的咱不懂就不瞎说了,但是 Apple 这么多年的策略以及这次的说辞,目前推出的款式都是基本 / 入门 / 分专业款,Apple 并没有为这些款式预留可扩展性,以及内存目前最大的 16GB ;等到 Pro 4C 口,iMac,甚至最终级的 Mac Pro,Apple 自然会推出更多的配置选项,以及可能会倾向把可扩展性留给最后面这款。
    区分 Pro 和非 Pro 用户,降低用户选择难度,就像 iPhone 系列一样。
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4027 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 86ms · UTC 05:18 · PVG 13:18 · LAX 21:18 · JFK 00:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.