坐享其成!!!想赚就赚!!!想富就富!!!

「思朗科技」从中国科学院到硅烷技术:中国超高性能芯片诞生之路

來源

「思朗科技」从中国科学院到硅烷技术:中国超高性能芯片诞生之路

作者|李梅

5G到達的过程正在加速。

目前,5G正處於標準确定的關鍵階段。今年6月,國際标準組织3GPP将很快完成第一版5G國際標準。与此同时,该政策是有利的和不間斷的。4月24日,国家發改委和財政部发布通知,下调5G公共移動通信系统&hellip的頻率占用费标準;& hellip

5G技術不僅能支持包括汽车在內的各種機器人的順利互聯,还能实现智能手机、智能家居、人工智能、大数据和云計算等許多領域的互联。质量和现状。基础技术的升級。

面对即将到来的5G浪潮,中國芯片產业準備好了吗?盡管还有很长的路要走,但以華为海斯为代表的中国智力建设仍在意料之中。目前,华為海斯是基帶領域唯一一家与高通媲美的中國公司。這是過去30年來华為各种因素积累的结果,不可能一蹴而就。

在初创公司层麵,也有一家特別特别的公司:思朗科技(Silang Technology),誕生于中国科学院自动化研究所和原國家專用集成电路設计與工程技術研究中心(成立于1992年),由该中心前主任、中國科學院自動化研究所前主任王林東博士领導,開發了一款高性能微處理器MaPU,MaPU在代數算法層面實现了全局優化,并首次高度可编程,2015年成功流式傳輸。

MaPU不僅能充分实现國际巨頭可編程处理器的性能,而且功耗比相当于專用集成电路(ASIC)。基于MaPU,思朗科技在三個主要领域进一步開發了處理器:UCP用于5G通信,UMP用于多媒體,HPP用于超级计算。同时,還配备了人工智能領域處理器:深神经網络引擎NNE。

最近,在中国科學院自動化研究所,投資界采訪了思朗科技的创始人和首席科學家王林东。王林东是世界上第一個提出代数算法水平-& ldquo;全局優化计算。架構,基于该架构設計的MaPU在計算能力和性能功耗比方面具有国际領先水平。

思朗科技创始人兼首席科學家王林東

高性能域微处理器MaPU

王林东介绍说,MaPU具有計算能力强、功耗低的特点。

目前,市場上通常使用幾种类型的處理器。一種是可编程處理器,如英特爾和鈦处理器,因為它們具有可編程性和广泛的適應性。然而,当执行数學算法时,其算术单元的利用率通常約为15%,高利用率為20%。TI的處理器,運算单元的最高利用率隻能達到40-50%。这意味着这些处理器空具有如此高的频率和空具有如此多的资源,但是它們的執行效率不高。

還有一个不需要编程的专用集成電路解决方案,它使用硬件编寫算法流程和算法控製。這实際上是算法的加速器,所以執行效率會非常高,接近100%。

显然,可編程处理器和专用集成電路在功耗上有很大差异。專用集成電路的問题是效率很高,但算法是不可变的。只要算法稍有改變,芯片就不能使用。

MaPU不僅與專用集成電路(ASIC)效率相近(计算资源利用率可達90%以上),而且具有高度可編程性,兩者兼具優勢。

以超級計算芯片為例,MaPU具有世界上最高的性能功耗比。

在王林東看来,當前主流可编程處理器的核心問題是,它是一種指令级別低的傳统架構,试圖在运行时通过无序多问題等技术盡可能多地实現本地並行執行。这导致計算資源利用率低、數據输入輸出量大、动態功耗大以及芯片整體性能/功耗比低。它已經不適应当今社会对微处理器巨大計算能力和极低功耗的雙重需求。如果可以從整个应用算法中考慮不同维度的並行特征,例如時间和空並且这些並行特征可以用于整體優化,那麽其内核中算术单元的利用率将大大提高。因此,王林東和他的團隊通过精确的计算和實验,在代数算法层麵上提出了全局優化的解決方案。

&ldquo。指令可以實现代數算法,所以它被称為代数指令。傳統体系结构的指令集都是算術运算級指令。&rdquo。王林东说,MaPU將其升級为代数算法指令。MaPU通过代数指令软流水线动态重構零延遲硬件架构(适應算法),实现與專用集成电路相同的算法架構,實现整個算法的全局最優執行過程。&rdquo。

簡而言之,MaPU不仅支持應用算法级的全局優化,还可以通过高度可重構的計算架構和存储係統在軟件级实現。MaPU可以灵活地適应各种領域的算法(5G通信、多媒体、超级计算或人工智能)。可以说,MAPU集成了專用集成電路、现场可编程门阵列和中央處理器的优勢,幾乎可以与專用集成电路的性能功耗比相媲美。軟專用集成電路。&rdquo。

&ldquo。MaPU-代數计算微處理器在並行代數计算、並行存儲係统指令系統和硬件架构方麵产生了重大的创新,將微處理器硬件支持從标量/超標量计算升級到代数计算級别,并将微处理器在計算密集型領域的能效比提高了一个数量级。&rdquo。王林东總結道。

那麽,具體的性能和功耗比指标呢,王林东給出了一组直觀的对比數據:

以极光H1.0超級計算芯片为例,芯片中集成了32個HPP處理内核,雙精度浮點處理能力將达到4,659GFLOPS @ 64,估计功耗仅為40W左右,性能功耗比为116GFLOPs@64/W,居世界首位。

因此,在MaPU應用大規模生产後,其原有的架构优势有望使中國在微處理器架构上实现重大突破,在同等能耗比下釋放出巨大的计算能力,引领中国電子產业的自主创新和发展。

對此,中國科學院院长白春麗今年3月在媒体上表示:& ldquo在高科技产品的研发中,中国科學院將很快发布一款具有完全自主知識产權的微处理器-& mdash;& mdashMaPU代數处理器达到國际领先水平。相信MaPU系列处理器问世後,將在世界计算機、通信等領域以及廣闊的消費电子市场产品中大放异彩。&rdquo。

&ldquo。马普的三个孩子。

在MaPU的基础上,思朗科技進一步开發了三款功能強大的域处理器:5G通信域处理器UCP、多媒體域處理器UMP和超級计算域处理器HPP。

UCP:軟件无線电在世界上首次完全实現。

UCP是MaPU针对移動通信的增强型通用通信處理器,是5G宏基站基站處理器的芯片核心。UCP内核每秒可完成5.8G定點复數快速傅立叶变換、55GBPS編码和2.5GBPS解码。根據初步计算,一個20個UCP核的基带處理器可以满足64天線5G宏基站的所有基带处理要求。

&ldquo。如果用FPGS構建5G系統,需要多片互連來实現系统解決方案,而基于FPGA的电路系統一般主頻< 400-600兆赫,芯片間互連總线帶宽有限,計算能力有限,这將成为实現5G系统的瓶頸。&rdquo。王林東说。

目前,UCP内核是世界领先的处理器内核,以可接受的成本实現完全软件定义的5G無線傳輸基帶处理系统。王林東将UCP定義为& ldquo軟件定義的無線电,在移動通信領域徹底實現基帶處理。&rdquo。

除了基站设备制造商,UCP核心也可以提供給5G終端制造商。由於5G標准,所有终端都必須重新嵌入適應5G算法的基帶核心(原始基带核心或數字信号处理器核心无法处理5G下行接收和上行傳输中的大量計算),这也是UCP核心的一個机會。各種領域的一體化无線通信设備和寬带特设网络終端也是空房間,UCP可以通過完全软件定義的无线電技术展示其能力。

UMP:凭借智能手机和智能电視,您可以在線升級視聽體验,并为高清摄影和攝像等應用提供超級引擎。

地圖是第二个。儿童。智能手機和智能電视的多媒体微處理器內核。

UMP在MaPU基本架構的基础上發明了一種更高效的并行處理架构,使得各種視频處理操作的性能/功耗比可与asic媲美,甚至在某些方面胜出,同時保持了高可编程特性。

&ldquo。這一特性可以使家用電視随着电視製造商视頻和音頻处理算法的发展而在线改善視频和音頻体驗效果,這是專用集成电路电视芯片无法比擬的。&rdquo。王林东說,& ldquo同時,通过算法和軟件改進,新產品可以快速推出。&rdquo。

由4個UMP内核和1個ARM内核組成的超高清电視引擎芯片(功耗小於8W)能夠满足4K超高清电視的所有視頻和音頻处理要求以及基於安卓係統的电视管理的所有要求,视听效果可以與索尼和三星的高端电视媲美。由14個UMP內核和1個ARM内核組成的超级电视引擎芯片可以滿足8K UHD電視的所有處理和計算要求。

隨着Silang开发的人工智能领域的深层神經網絡引擎NNE内核的加入,智能電视和智能手机在高清视頻、機器视覺和人機交互方麵都能實現性能的大幅提升,让国內消费电子產品以更低的成本大幅提升用户體验。第一款超級電視引擎芯片将於2018年底推出,并可开始應用于智能電視製造商。

與英特尔最新處理器相比,HPP核心超级计算處理器将性能/功耗比提高了近一個數量級。

目前,馬普的第三個& ldquo儿童。HPP內核已经是一个成熟的產品。

&ldquo。MaPU通過架構創新獲得的核心能力仍然是高密度計算。&rdquo。因此,王林東一直希望通過MaPU为通用計算領域的增強型核心HPP(高性能处理)組建一个超級計算微处理器,以滿足高端服務器領域的需求。

因此開發了極光H1.0 & mdash& mdash超级计算MaPU微處理器(流式和密封預计年底完成)已經被設計用來评估極光H1.0的性能/功耗比,該性能/功耗比遠高于世界上其他超級計算微处理器,可用作超级计算係統和超级計算机的核心處理器。

王林東给了一套数據:

基于HPP内核的超級计算处理器奥罗拉H1.0與英特爾最新的至強融核(Xeon Phi)性能相同,但可靈活配置16/32/64/128位,性能/功耗比提高了近一個数量級:奧羅拉H1.0(2x16 HPP內核)消耗40W,而英特爾至強融核处理器消耗300W,同时提供相同的64位浮點計算能力。

NNE:顶级深层神经網絡處理

矽烷的另一個產品:NNE,一个加速的神經网絡引擎,继承和發展了MaPU的& ldquo同心圓存储系统优化模型及現状;,并針对深層神經网络進行优化。其优势是主流神经網络的高吞吐量、低內存访問和功耗,相當於Avida Deep神经网絡的核心性能,但效率更高。Silang的NNE在存儲系統和深層神經網络配置中吸收了MaPU全局優化思想,具有明顯的性能功耗比优勢。

&ldquo。NNE可以支持深入的学習训练,尤其是智能推理。它在視頻图像识別方麵进行了专门的優化,在目标检测、识別和视频图像構造方面具有突出的優勢。&rdquo。。王林东介紹。

一个預期的應用场景是智能駕駛,其中UMP可以高速处理多个攝像機图像并提取要识别的目标。NNE負責理解、判断和处理路况和车辆状況,並提供决策和驾駛控制所需的關鍵信息;UCP负责为車輛聯網提供非常短的延迟通信能力。

甘坐在长凳上,坚持发展一个研究團队將近10年。

Silang及其前身团隊从2009年開始將對新指令集架构的研究部署到开发完全独立和創新的微处理器架構MaPU,經历了九年的艱苦工作。研發團隊是来自原國家專用集成電路设计工程技術研究中心的70多名核心科研人員。

从2017年第二季度开始,该团隊开始公司化運营。

王林東是一个有技术信仰的人,他的队友也是。集成电路領域一直缺乏人才。因為製作芯片和其他硬件太难,收入不高,许多優秀的学生毕业後更願意選擇金融和互聯網。制造芯片需要工匠的精神和頂尖技術人员全心投入研發的意願,能够長期承受成功研發的壓力。矽烷科技的研發团隊做到了這一点。

几个基於MaPU的增強型域处理器在各自的域中都有自己的優勢。事实上,它们也可以組合使用,從而登陆各种實際場景:5G通訊、智能手机、智能家居、超級计算、智能駕駛、智能城市、机器人和无人驾驶飛行器等。

&ldquo。摩爾定律不能永遠适用。芯片性能升级遇到了全球瓶颈,這正是我們迎头赶上的最佳機會。&rdquo。王林東說,& ldquo芯片是一个需要耐心的行業。我们已經做了9年了。基础已经奠定。下一個重点是在实际应用中對其進行调整和優化。&rdquo。

免责声明:非本网注明“禁止转载”的信息,皆为程序自动获取互联网,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责;如此页面有侵犯到您的权益,请给站长发送邮件,并提供相关证明,站长将在收到邮件24小时内删除。