免费成人黄动漫网站-免费成人高清在线视频-免费成人高清视频-免费成人高清-中国特级毛片-中国特级黄色片

房叔話安防 之 深鑒科技姚頌要扛起深度學(xué)習(xí)的大旗

2018-02-05 · 作者:房叔話安防

[導(dǎo)讀]2018年起始之時,深鑒科技已經(jīng)擁有六款產(chǎn)品:深度學(xué)習(xí)開發(fā)SDK DNNDK、人臉檢測識別模組(前端)、人臉分析解決方案(后端)、視頻結(jié)構(gòu)化解決方案(人/車分析)、深鑒ARISTOTLE架構(gòu)平臺、語音

房叔話安防 之 深鑒科技姚頌要扛起深度學(xué)習(xí)的大旗 - 張新房 - 張新房的博客 - AI+安防

緣起深圳安博會

2017年11月1日,深圳安博會的現(xiàn)場,雖然展會進(jìn)行到了最后一天還是人頭攢動。AI毫無疑問引爆了整個安博會。早就聽說深鑒科技的大名,在空閑時間趕緊按照我事先列好的AI企業(yè)名單來到了深鑒科技的展位,他們的商務(wù)經(jīng)理Fleda Liu很熱情的招待了我們,耐心仔細(xì)的解釋促使我寫一篇文章,我向她表明我自媒體的身份,打算寫一篇關(guān)于深鑒科技的文章,我要信守我的承諾,就有了這一篇文章。

一個好漢三個幫

詳究深鑒科技的發(fā)展歷程,就是一個好漢三個幫的故事。

好漢姚頌1992年出生,深鑒科技創(chuàng)始人兼CEO。大概是長沙人,因為姚頌第一次見諸報端,2008年就讀長沙市一中的他被保送清華大學(xué)。

媒體報道高中時期的姚頌還是有幾分靦腆,笑起來圓圓的臉龐上還有兩個酒窩。據(jù)姚頌自己說“從小學(xué)二年級開始到初三都是學(xué)的數(shù)學(xué)奧賽。進(jìn)入高一時,他非常喜歡物理,同時也仰慕學(xué)校的金牌物理教練黃洪才,聽說他帶三屆學(xué)生拿了4塊金牌,于是臨時決定轉(zhuǎn)攻物理奧賽。”而他不負(fù)眾望獲得全國中學(xué)生物理競賽二等獎,含金量極高的全國聯(lián)賽一二等獎都可保送清華、北大。除了物理,姚頌還是多才多藝的,吉他、繪畫、籃球都是他的最愛。

得知保送后,姚頌開始自學(xué)C語言編程,也堅持學(xué)習(xí)英語。

2011年進(jìn)入清華大學(xué)后,姚頌就讀電子系,在大一的時候就天賦初現(xiàn)。2012年年初進(jìn)入汪玉博士的實驗室,從三維集成電路設(shè)計、硬件安全等CAD方面的研究開始,后轉(zhuǎn)而鉆研計算機(jī)體系結(jié)構(gòu)。2014年7月前往斯坦福大學(xué)電子系進(jìn)行2個月的LLVM編譯器開發(fā)實習(xí)。2014年9月以后在微軟亞洲研究院實習(xí)(上篇文章報道印奇也是在這里實習(xí)),方向是設(shè)計與開發(fā)應(yīng)用于必應(yīng)搜索引擎專用加速處理器的專用編譯器,正是在此奠定了姚頌的創(chuàng)業(yè)基礎(chǔ)和方向:深度學(xué)習(xí)硬件。大學(xué)期間他還擔(dān)任電子系科協(xié)主席,舉辦過一系列科創(chuàng)賽事,因此大三時就被同學(xué)稱為“姚老板”(現(xiàn)在是名副其實,這是后話),主要成就是獲得ACM學(xué)生科研競賽金牌、“星火計劃”第八期成員。

2015年畢業(yè)之際,姚頌獲得卡內(nèi)基梅隆大學(xué)的博士Offer(當(dāng)然還有高額學(xué)術(shù)獎金),雖然父母反對他還是放棄了這個機(jī)會,創(chuàng)業(yè)和深造之間他選擇創(chuàng)業(yè)。

2015年的清華學(xué)子想必很躁動,做出一番事業(yè)深入人心,姚頌也不例外。將最前沿的深度學(xué)習(xí)理論應(yīng)用到產(chǎn)品中,他們看到了其中的商業(yè)價值和歷史機(jī)遇,姚頌的導(dǎo)師早在2013年就布局以機(jī)器智能為核心的硬件加速研究,大洋彼岸另一位深度學(xué)習(xí)的專家也在尋找創(chuàng)業(yè)機(jī)會。清華大學(xué)對技術(shù)和產(chǎn)業(yè)的孵化作用,就好比斯坦福和麻省理工。這類學(xué)校的技術(shù)可以孵化出來很多現(xiàn)在著名的科技企業(yè),那清華可不可以?這是他們的目標(biāo)。

2015年7月,姚頌畢業(yè)之際,隨著實驗室算法做的越來越好,合作的項目也在不斷增加的情況下,技術(shù)的商業(yè)落地情況卻始終不能讓姚頌滿意,姚頌判斷是時候成立一家公司來解決這個問題了。“2015年11月28日,我們幾個聯(lián)合創(chuàng)始人一拍即合,準(zhǔn)備創(chuàng)業(yè)。第二天我就拉著姚頌開始寫B(tài)P,清華很支持創(chuàng)新創(chuàng)業(yè),人工智能又需要有基礎(chǔ)的硬件平臺,當(dāng)時我們的技術(shù)可演示,就覺得天時地利人和。”另外一個創(chuàng)始人事后回憶,市面上也流傳玩笑說:清華這撥人上了清華以后,畢業(yè)找個好工作,培養(yǎng)一個娃,再上清華,就這樣做輪回。姚班之后,這種情況大大改觀。姚頌是清華大學(xué)“星火計劃”八期成員,學(xué)校允許大三、大四的學(xué)生申請,這樣深鑒科技就在清華“創(chuàng)+”孵化項目的支持下開始創(chuàng)業(yè),用他自己的話說,是“比較特殊的一期”。

2016年3月,姚頌與來自清華和斯坦福的學(xué)者們聯(lián)合創(chuàng)立深鑒科技,目前專注于利用深度學(xué)習(xí)提高運(yùn)算效率,為AI提供落地處理器平臺和SDK。但創(chuàng)業(yè)都沒有一帆風(fēng)順的,據(jù)姚頌回憶“在創(chuàng)業(yè)前融資那段是特別黑暗的時期,但同時也是對他整個人提升最大的時期。”公司成立之后,面臨諸多挑戰(zhàn),姚頌身兼CEO、CTO、CFO和COO多個角色但不能間顧,想必是手忙腳亂、溝通不暢。當(dāng)然對于一名剛剛畢業(yè)的學(xué)生而言,自然有個自我學(xué)習(xí)的過程,初始團(tuán)隊能夠隨著企業(yè)業(yè)務(wù)的壯大同步成長,是所有偉大企業(yè)的共同特征。

好在這是一只聰明大腦組成的隊伍,雖然團(tuán)隊年輕卻充滿活力和學(xué)習(xí)能力。創(chuàng)始初期深鑒擁有8名員工,3位創(chuàng)始人、2位有工作經(jīng)驗的工程師、3個姚頌的同學(xué),然而這8個人并沒有全部堅持下來,中途有人離隊,初創(chuàng)AI企業(yè)大多數(shù)面臨了更大的困境,團(tuán)隊要能夠抵住壓力、不斷學(xué)習(xí),還要將技術(shù)盡快轉(zhuǎn)換成產(chǎn)品落地,而時間卻是以天為單位進(jìn)行計算的,人工智能的發(fā)展速度實在是太快了。

最初深鑒的產(chǎn)品定位是無人機(jī),很明顯大疆是市場的絕對領(lǐng)導(dǎo)者,而且數(shù)量級也在百萬臺,留給深鑒科技的機(jī)會并不多。后來決定專注于深度學(xué)習(xí)處理器領(lǐng)域,深度學(xué)習(xí)處理器一定要經(jīng)過模型壓縮、模型定點(diǎn)化、編譯三大步驟,并且一定要擁有針對神經(jīng)網(wǎng)絡(luò)的專用結(jié)構(gòu)。發(fā)現(xiàn)問題之后的團(tuán)隊決定攻克難關(guān),經(jīng)過努力,另一位創(chuàng)始人也成功研發(fā)了一種名為“深度壓縮”的技術(shù),它不僅可以將神經(jīng)網(wǎng)絡(luò)壓縮數(shù)十倍而不影響準(zhǔn)確度,還可以使用“片上存儲”來存儲深度學(xué)習(xí)算法模型,減少內(nèi)存讀取,大幅度減少功耗,從而奠定了深鑒的技術(shù)基礎(chǔ)。經(jīng)過轉(zhuǎn)型深鑒科技終于有了清晰的使命“開拓人工智能的應(yīng)用邊界,開發(fā)壓縮、編譯、加速三位一體的自動化流程,實現(xiàn)算法、軟件、硬件協(xié)同優(yōu)化,賦予世界每個節(jié)點(diǎn)以智慧。”

聚焦哪些行業(yè)深鑒考慮過很多,無人機(jī)、安防、自動駕駛、醫(yī)療設(shè)備、家居物聯(lián)網(wǎng)等,最終選擇轉(zhuǎn)型做安防(當(dāng)然無人機(jī)的積累并沒有放棄)。基于無人機(jī)技術(shù)的積累,著手開發(fā)壓縮、編譯、加速三位一體的自動化流程,試圖實現(xiàn)算法、軟件、硬件協(xié)同優(yōu)化,為開發(fā)者打造高效的深度學(xué)習(xí)DPU平臺(Deep Learning Processing Unit,深度學(xué)習(xí)處理單元)。姚頌的團(tuán)隊在適應(yīng)AI熱浪的過程中也是花了大力氣的,不僅從事算法層面的研究、還關(guān)注技術(shù)在硬件層面的應(yīng)用,高度聚焦算法壓法,這讓深鑒明顯有別與市面上的AI初創(chuàng)企業(yè),獨(dú)樹一幟。

2018年起始之時,深鑒科技已經(jīng)擁有六款產(chǎn)品:深度學(xué)習(xí)開發(fā)SDK DNNDK、人臉檢測識別模組(前端)、人臉分析解決方案(后端)、視頻結(jié)構(gòu)化解決方案(人/車分析)、深鑒ARISTOTLE架構(gòu)平臺、語音識別加速方案。而DNNDK要對標(biāo)英偉達(dá)的TensorRT,DNNDK提供了一套完整全流程軟件工具鏈,涵蓋了神經(jīng)網(wǎng)絡(luò)推理(Inference)階段從模型壓縮、異構(gòu)編程、編譯到部署運(yùn)行的全流程支持。降低了深度學(xué)習(xí)算法工程師和軟件開發(fā)工程師DPU平臺深度學(xué)習(xí)應(yīng)用開發(fā)的門檻和部署難度,縮短算法部署到硬件的周期,加快了AI產(chǎn)品研發(fā)過程。當(dāng)然姚頌還有更大的雄心“建立人工智能的軟件生態(tài)環(huán)境、活躍的社區(qū)才有更本質(zhì)的發(fā)展空間。”

根據(jù)媒體報道,在AI芯片大熱的如今,預(yù)計深鑒科技自主研發(fā)了“聽濤”和“觀海”AI芯片將于2018年面世,留給深鑒的時間并不多,“加速快跑,在巨頭推出落地產(chǎn)品之前,把自己的產(chǎn)品落地并實現(xiàn)商業(yè)化。”,目前,深鑒已經(jīng)和三星在存儲方面達(dá)成合作,加速深鑒邁進(jìn)商業(yè)化階段,在金融領(lǐng)域深鑒和螞蟻金服共同開拓市場和應(yīng)用場景。

最近三年,得益于GPU在深度學(xué)習(xí)的應(yīng)用,中國誕生了一大批人工智能企業(yè),包括人臉識別四大獨(dú)角獸:曠視、云從、商湯和依圖,而相比前者,深鑒的名氣要小很多。2017年2月,創(chuàng)始人一篇論文《ESE: Efficient Speech Recognition Engine with Sparse LSTM onFPGA》獲得了FPGA大會最佳論文獎,使得深鑒科技被國內(nèi)外媒體大面積曝光,而深鑒科技的業(yè)務(wù)也逐漸走向正軌。

2017年入選福布斯中國30位30歲以下精英榜,這一年姚頌25歲。

汪玉老師

企業(yè)的成功離不開團(tuán)隊,好漢姚頌就有三個幫手:汪玉(創(chuàng)始人)、韓松(首席科學(xué)家)和單羿(CTO)。

房叔話安防 之 深鑒科技姚頌要扛起深度學(xué)習(xí)的大旗 - 張新房 - 張新房的博客 - AI+安防

姚頌大一進(jìn)入汪玉的實驗室,作為姚頌的導(dǎo)師,汪玉博士出生于1982年,畢業(yè)于清華大學(xué)。正是因為汪玉兩位清華學(xué)長韓松和單羿也加入了深鑒科技,四個合伙人對深度學(xué)習(xí)有不同的細(xì)分研究,汪玉負(fù)責(zé)帶領(lǐng)學(xué)生重點(diǎn)研究硬件加速、韓松擅長處理器芯片和壓縮技術(shù)、姚頌除了做研究院更多承擔(dān)了管理者的智能。

深鑒科技能夠被創(chuàng)立,少不了電子系汪玉博士的功勞。汪玉本是清華大學(xué)長聘副教授,本著同在清華姚班的影響,汪玉也大抵希望自己的團(tuán)隊也能夠走出優(yōu)秀的創(chuàng)業(yè)企業(yè),實現(xiàn)產(chǎn)學(xué)研的結(jié)合。1996年初中畢業(yè)的汪玉就以優(yōu)異成績考入“全國理科實驗班”,進(jìn)入了清華大學(xué)附屬中學(xué)學(xué)習(xí),此后就一直未離開清華。清華大學(xué)電子工程系是有名的高分、難考,而學(xué)霸們都是因為這個原因選擇它,汪玉在電子系讀到博士畢業(yè),并未選擇留美深造,最終選擇留校成為一名助理教授,放棄了一直研究的集成電路設(shè)計轉(zhuǎn)型“硬件加速”,汪玉也有在微軟的實習(xí)經(jīng)歷,具備天然的創(chuàng)業(yè)條件,但汪老師最終還是選擇教書育人,教育是更偉大的事業(yè),具備長期效應(yīng)而不僅僅是金錢的回報。后來汪玉老師創(chuàng)建了實驗室,其中的學(xué)生就包括了姚頌,正是在這個時期,他們開始了對深度學(xué)習(xí)軟件的深入研究。當(dāng)然最后汪老師經(jīng)不住姚頌勸說,最終還是走出校門和自己的學(xué)生們聯(lián)合成立了深鑒科技,當(dāng)然老師的身份還是保留了。

汪老師的想法顯然更久遠(yuǎn)一些“我們希望所有帶攝像頭的地方,或者需要語音交互的地方,都有我們的產(chǎn)品存在。”這是一個巨大的市場,深鑒有別于同行,著力于打造基于DPU的端到端的深度學(xué)習(xí)硬件解決方案,除了承載在硬件模塊(訂制的PCB板)上的DPU的芯片架構(gòu)外,還打造了針對該架構(gòu)的DPU壓縮編譯工具鏈SDK,深鑒科技不會只做“一家賣芯片的公司”。

汪玉在接受媒體采訪時曾說:“創(chuàng)新是一個企業(yè)的原動力。然而,在追求創(chuàng)新的過程中,時間成本與市場需求是萬萬不可忽視的關(guān)鍵因素,當(dāng)一項技術(shù)的應(yīng)用離現(xiàn)實太遠(yuǎn)、而市場回報又十分的不確定,只一味的追求企業(yè)‘自嗨’,那結(jié)果便可想而知了。”如今面對客戶,汪老師就變成企業(yè)主,更加關(guān)于產(chǎn)品的迭代和用戶的需求,而不限于學(xué)術(shù)研究的某項性能或者參數(shù)。汪玉很清楚自己的責(zé)任,也很享受當(dāng)前的狀態(tài)。他相信終有一天,深鑒科技可以改變?nèi)藗兊纳睿菚r的他也將拿著深鑒科技所帶來的利潤反哺清華。

韓松是深鑒科技聯(lián)合創(chuàng)始人

本科畢業(yè)于清華大學(xué)電子工程系、是斯坦福大學(xué)電子工程系博士,獲得ICLR2016最佳論文、FPGA2017最佳論文,一直引領(lǐng)世界深度學(xué)習(xí)壓縮與硬件加速研究。韓松博士提出的深度學(xué)習(xí)部署方案,跟傳統(tǒng)的方案相比,可以使得推理更快、能耗更低。該項工作聚焦于使用 LSTM進(jìn)行語音識別的場景,結(jié)合深度壓縮(Deep Compression)、專用編譯器以及 ESE 專用處理器架構(gòu),在中端的 FPGA 上即可取得比 Pascal Titan X GPU 高3倍的性能,并將功耗降低3.5倍。這正式韓松厲害的地方,也是深鑒的。

韓松認(rèn)為創(chuàng)業(yè)是一個很自然的過程,在實驗室做的研究成果到了成熟的地步,如果遇到合適的商業(yè)機(jī)會,一拍即合,一切就水到渠成了。然后就可以去和風(fēng)投講,風(fēng)投一般會對校園里研究出來的黑科技很感興趣,相比起門檻低一點(diǎn)的商業(yè)模式的創(chuàng)新,更加具有吸引力。

市面上關(guān)于CTO單羿的消息很少,這里就不加詳述了。單羿1985年出生,2004年考入清華大學(xué)電子工程系,是汪玉老師的第一個博士生,先后任職百度深度學(xué)習(xí)研究院高級工程師、地平線機(jī)器人FPGA技術(shù)負(fù)責(zé)人。

基礎(chǔ)數(shù)據(jù)分析

房叔話安防 之 深鑒科技姚頌要扛起深度學(xué)習(xí)的大旗 - 張新房 - 張新房的博客 - AI+安防

深鑒科技成立于2016年3月3日,員工約有70+人(初創(chuàng)企業(yè),人數(shù)在不斷增長中),先后融資5000萬+美元,尚未透露收入和利潤信息,專注于安防領(lǐng)域的深度學(xué)習(xí),以深度學(xué)習(xí)芯片名揚(yáng)天下。

深度學(xué)習(xí)的大旗

2016年6月在OpenPOWER峰會上,F(xiàn)PGA芯片領(lǐng)頭企業(yè)Xilinx介紹了有關(guān)深度學(xué)習(xí)處理器的新方法,而其中有關(guān)技術(shù)的部分大多來自于深鑒科技。2017年2月,在頂級學(xué)術(shù)大會FPGA 2017會議上,深鑒科技又成為該屆最佳論文獎的唯一獲得者。姚頌也承認(rèn)他們很幸運(yùn):“不得不說,我們真的很幸運(yùn),把剛剛嶄露頭角的‘深度學(xué)習(xí)’定為研究方向,在AI即將爆發(fā)之際創(chuàng)立的深鑒科技,如果早誕生三年,我們可能一直無法突破技術(shù)與產(chǎn)品之間那一層薄薄的窗戶紙。同樣,當(dāng)我們每次取得重大突破的時候,都好像在不斷觸及心里那個‘深度’的極限。”

算法的實現(xiàn)高度依賴于高性能的計算能力,而圖形處理器(GPU)、現(xiàn)場可編程門陣列(FPGA)、專用集成電路(ASIC)扮演著重要的角色。GPU可以平行處理大量瑣碎的信息,代表廠商是Nvidia;而FPGA憑借其可編程專用性、高性能、低功耗的特征,同樣在深度學(xué)習(xí)應(yīng)用中展現(xiàn)獨(dú)特的優(yōu)勢,代表廠商為英特爾、賽靈思(Xilinx)。在中國提供基于FPGA解決方案的代表廠商就是深鑒科技。

ICLR(the International Conference on Learning Representations)大會是近年來在深度學(xué)習(xí)領(lǐng)域影響力飆升的行業(yè)會議,旨在討論如何更好的學(xué)習(xí)有意義、有價值的數(shù)據(jù),從而應(yīng)用于視覺、音頻和自然語言處理等領(lǐng)域。大會聯(lián)合主席為深度學(xué)習(xí)領(lǐng)軍人物Yoshua Bengio和Yann LeCun。在2016 年5月舉辦的ICLR大會上,有兩篇論文獲得了“2016年ICLR最佳論文”獎。一篇來自AlphaGo開發(fā)者谷歌DeepMind,另一篇則來自深鑒科技首席科學(xué)家韓松,他在論文中解釋了如何利用“深度壓縮”(Deep Compression)技術(shù),將神經(jīng)網(wǎng)絡(luò)壓縮數(shù)十倍而不影響準(zhǔn)確度,從而降低計算復(fù)雜度和存儲空間。可見深鑒科技在深度學(xué)習(xí)領(lǐng)域的影響力。

深鑒科技的英文名為DeePhi,而“DeePhi”源于“Deep Learning”與“Philosophy”,深鑒相信只有從根源理解和探索深度學(xué)習(xí),從底層不斷地創(chuàng)新,才能驅(qū)動更多的人工智能技術(shù)走向應(yīng)用,可見深鑒科技的“姚老板”是要扛起深度學(xué)習(xí)這面大旗的。

技術(shù)之路

在探討深鑒科技的技術(shù)之路前,先來了解英偉達(dá)。人工智能性技術(shù)革命甚至可以比肩第三次工業(yè)革命,被稱之為第四次工業(yè)革命,而人工智能的本質(zhì)之爭正是芯片之爭,誰能掌握AI芯片領(lǐng)域的主導(dǎo)權(quán),誰就有可能領(lǐng)先世界,這波AI熱潮成績了英偉達(dá)。2008年那一年,英偉達(dá)內(nèi)憂外患,大客戶AMD收購了ATI,形成了CPU整合GPU的新Solution,因此AMD和英偉達(dá)由合作變?yōu)楦偁庩P(guān)系,要命的是Intel也終止了和英偉達(dá)的合作,兩個大客戶的丟失,擺在英偉達(dá)面前的只有高端獨(dú)立顯卡一條路,屋漏偏逢連陰雨,高端顯卡因質(zhì)量問題遭到諸多質(zhì)疑,股票暴跌、營收大減,由此進(jìn)入4年的蟄伏期。事情的轉(zhuǎn)機(jī)出現(xiàn)在2012年,英偉達(dá)將CPU芯片用于斯坦福大學(xué)深度學(xué)習(xí)項目上,開拓顯卡用于圖像計算以外的用途,終于釋放了GPU芯片的大規(guī)模并行計算能力,成為人工智能發(fā)展的底層基礎(chǔ)。之后的英偉達(dá)勢不可擋,市值2年內(nèi)暴漲了10倍并很快突破千億美元市值,這都?xì)w功于GPU在AI領(lǐng)域的應(yīng)用。有人甚至斷言“沒有GPU就沒有英偉達(dá),而沒有英偉達(dá),就沒有現(xiàn)今這一波人工智能浪潮!”。不夸張的說,現(xiàn)今世界上所有涉足人工智能的公司幾乎都在使用英偉達(dá)的GPU芯片。

接下來還需要闡述一個基本概念:FPGA(現(xiàn)場可編程門陣列,F(xiàn)ield-Programmable Gate Array)。簡而言之,這是一種程序驅(qū)動邏輯器件,就像一個微處理器,其控制程序存儲在內(nèi)存中,加電后,程序自動裝載到芯片執(zhí)行。FPGA作為專用集成電路領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了全定制電路的不足,又克服了原有可編程邏輯器件門電路數(shù)有限的缺點(diǎn)。

FPGA的“可編程”指的是可以用戶通過重新配置邏輯資源來不停嘗試,通過編輯不同的配置文件把同一個FPGA進(jìn)行不同屬性的設(shè)置,直到獲得最佳方案,非常靈活。而深度學(xué)習(xí)作為一門尚在發(fā)展中的技術(shù),F(xiàn)PGA的這種靈活、可編程、允許試錯的特性對它來說是非常友好的,這是第一點(diǎn)。除了靈活性外,第二點(diǎn)則是功耗,一塊GPU的功耗多數(shù)超過100W,明顯不適用與無人機(jī)、攝像機(jī)這樣功耗敏感型硬件,而FPGA的功耗可以做到3W、4W。第三點(diǎn)則是延遲問題,雖然GPU的運(yùn)行速度比FPGA快,但是GPU的高性能來自于它的并行處理能力,訓(xùn)練時效果很好,但在應(yīng)用時一次性只能處理一張輸入圖像,優(yōu)勢不能完全發(fā)揮,造成延時。正是這三個特點(diǎn),不少大公司開始逐漸注意到維護(hù)、采購、散熱、內(nèi)部損耗成本等問題,開始逐漸將FPGA引入自己的系統(tǒng)內(nèi),比如亞馬遜和賽靈思合作,推出了基于FPGA的亞馬遜云服務(wù)、百度大腦使用了基于FPGA版的AI專有芯片、騰訊云也發(fā)布FPGA云服務(wù)器等。

FPGA方案也有缺點(diǎn),那就是開發(fā)難度。FPGA需要使用硬件描述語言(Verilog或VHDL)而不是計算機(jī)語言,程序員需要在FPGA公司提供的編譯器基礎(chǔ)上進(jìn)行二次開發(fā),開發(fā)難度大、開發(fā)周期長等問題,這也是很多公司不愿意使用它的原因。深鑒相當(dāng)于給這些不愿意直接使用FPGA的廠商提供了一個帶接口的黑盒子,廠商把自己的算法模型訓(xùn)練好之后,將模型與數(shù)據(jù)通過接口傳入,由深鑒科技進(jìn)行壓縮和編譯,生成的指令可以在FPGA上運(yùn)行,廠商直接得到需要的輸出結(jié)果。據(jù)此深鑒科技提出了“DPU”這一概念,DPU相當(dāng)于把壓縮、編譯、執(zhí)行的整個“黑盒子”過程具象化,最后的落地形態(tài)是一塊板卡。

姚頌表示,現(xiàn)在很多公司在做各種各樣的算法,是最快的切入方式,但落地受限于性能、功耗和成本因素。“深鑒科技的產(chǎn)品將以ASIC級別的功耗,來達(dá)到優(yōu)于GPU的性能,可把它稱作DPU,深鑒的產(chǎn)品將會基于FPGA平臺。” 深鑒科技目前的開發(fā)板功耗在4瓦左右,能夠做到比一個15至20瓦的GPU性能高出兩倍。“相當(dāng)于原來是先訓(xùn)練一個算法,然后再編譯到CPU或GPU上運(yùn)行,現(xiàn)在你也可以通過我們的編譯器,把訓(xùn)練好的算法編譯到DPU就可以直接運(yùn)行了,在同樣的開發(fā)周期內(nèi),獲得相對于GPU一個數(shù)量級的能效提升。”姚頌說。

深鑒科技最早做研究時,這還是一個“冷門”的方向,國內(nèi)學(xué)界也僅有中科院的陳云霽博士在做類似的研究。但時至今日,深度學(xué)習(xí)專屬芯片已經(jīng)成為一種逐漸被認(rèn)可的方向。前百度IDL創(chuàng)始人余凱博士2015年創(chuàng)立了地平線機(jī)器人,國內(nèi)中科院背景的寒武紀(jì)科技已經(jīng)做出深度學(xué)習(xí)芯片,利用專有硬件實現(xiàn)深度學(xué)習(xí)及其相關(guān)應(yīng)用,已是大勢所趨。

現(xiàn)有的GPU采用“讀—算—寫 ”這樣的處理流程,只適用于深度學(xué)習(xí)算法的訓(xùn)練,在應(yīng)用層面性能低下且功耗很高。利用專有硬件實現(xiàn)深度學(xué)習(xí)及其相關(guān)應(yīng)用,則能高性價比解決性能與功耗的問題。2016年1月,深鑒科技就已經(jīng)設(shè)計出一套基于DPU的一整套深度學(xué)習(xí)硬件解決方案,包括DPU的芯片架構(gòu)、DPU編譯器、硬件模塊(訂制的PCB板)三部分。直接呈現(xiàn)的產(chǎn)品就是硬件模塊,共有嵌入式端和服務(wù)器端兩款。

產(chǎn)品功耗的降低和性能的提升主要依賴于算法上的創(chuàng)新和芯片結(jié)構(gòu)的創(chuàng)新。深鑒首席科學(xué)家韓松一直在研究“深度壓縮”技術(shù),可以將神經(jīng)網(wǎng)絡(luò)壓縮數(shù)十倍而不影響準(zhǔn)確度,可以使用片上存儲來存儲深度學(xué)習(xí)算法模型,減少內(nèi)存讀取,從而大幅度減少功耗。這一研究也得到了學(xué)界的認(rèn)可,已經(jīng)被選為2016年ICLR兩篇最佳論文之一。

在芯片結(jié)構(gòu)上,深鑒重新設(shè)計了專門的DPU架構(gòu)及編譯器。用戶可以正常通過GPU訓(xùn)練深度學(xué)習(xí)模型,并直接將模型編譯到DPU指令集,指令直接下載到DPU上,使得深度學(xué)習(xí)算法的運(yùn)行效率提高。另外還打造了針對該架構(gòu)的DPU壓縮編譯工具鏈SDK,而工具鏈里面的軟硬件協(xié)同優(yōu)化則是深鑒科技的一大優(yōu)勢。

現(xiàn)階段,深鑒科技正在打造云加端的深度學(xué)習(xí)應(yīng)用生態(tài),選擇的應(yīng)用領(lǐng)域都是大體量市場里具有提升空間的重要玩家。其中嵌入式端的產(chǎn)品將主要應(yīng)用在無人機(jī)、安防監(jiān)控、機(jī)器人、AR等領(lǐng)域,服務(wù)器端的產(chǎn)品將主要面向大型互聯(lián)網(wǎng)公司的語音處理、圖像處理等。

不過,由于DPU是專門針對于深度學(xué)習(xí)算法設(shè)計,其應(yīng)用范圍只能是深度學(xué)習(xí)算法,而不像CPU與GPU那樣通用。因此,在一些應(yīng)用場景中,需要以DPU為核心,輔之以非機(jī)器學(xué)習(xí)或者非深度學(xué)習(xí)的方式相結(jié)合來打造完整系統(tǒng)。

深鑒科技的未來技術(shù)之路將更加的崎嶇。繼續(xù)加大核心技術(shù)的研發(fā)和投入,重點(diǎn)加強(qiáng)在安防和數(shù)據(jù)中心行業(yè)的產(chǎn)品打造與市場推廣,為安防領(lǐng)域和行業(yè)用戶帶來智能化的變革。另一方面,將深度學(xué)習(xí)圖像和語音處理上的成果落地到更多的應(yīng)用場景,為更多行業(yè)提供最前沿的、端到端式的人工智能解決方案,這是深鑒目前的選擇。

融資+燒錢

深鑒科技天使輪之前,阿爾法狗還沒有引起人們對人工智能的關(guān)注,姚頌團(tuán)隊專注技術(shù)研發(fā),做出的成果更不知道以怎樣的方式讓社會上的人知道。姚頌坦言漫長的大半年內(nèi),深鑒科技在外界并沒有太多的名聲,那段時間融資極其不順利。

2016年4月,姚頌先后約見了金沙江創(chuàng)投和高榕資本兩家投資機(jī)構(gòu)。出乎意料的是,一周內(nèi)便拿到了這兩家的天使輪融資。彼時的金沙江創(chuàng)投已經(jīng)在人工智能領(lǐng)域盤旋多時,合伙人予彤認(rèn)為,人工智能初期解決算法能力問題,建立通用的基礎(chǔ)設(shè)施非常重要。更重要的原因天使輪最靠譜的就是熟人投資熟人,予彤同樣出身于清華大學(xué)電子系,認(rèn)識汪玉以及韓松,金沙江創(chuàng)投比其它一線基金有更多的機(jī)會和維度去深度感知深鑒科技的基礎(chǔ)技術(shù)、企業(yè)氛圍等。“中國有做這件事的團(tuán)隊,所以我們直接投了。”其后,2016年5月獲得500萬美元天使輪融資,投資方為金沙江創(chuàng)投和高榕資本。拿到融資后,姚頌安靜下來,開始帶領(lǐng)團(tuán)隊朝著既定的計劃往前走。前文述及他們選擇了兩條路線:技術(shù)線、產(chǎn)品線,直到轉(zhuǎn)型安防成功之后,路線才定下來。深鑒科技在技術(shù)和產(chǎn)品層面的同時推進(jìn),很快讓其迎來接下來的兩輪融資,2017年5月數(shù)千萬A輪融和2017年10月A+輪約4000萬美元融資。

A 輪融資投資方包括賽靈思(Xilinx)、聯(lián)發(fā)科(MediaTek)、清華控股、方和資本,原有投資方金沙江創(chuàng)投、高榕資本跟投,具體金額不詳。A+輪融資由螞蟻金服與三星風(fēng)投領(lǐng)投,招商局創(chuàng)投與華創(chuàng)資本跟投。其中A+輪資方之一華創(chuàng)資本的投資人公元對姚頌印象深刻,“他表現(xiàn)出來的為人處事的成熟、對商業(yè)思考的成熟以及對適應(yīng)事物的反應(yīng)速度,都遠(yuǎn)超同齡人。”金沙江創(chuàng)投的予彤也給了同樣的評價。

值得一提的是,除了資本方和產(chǎn)業(yè)合作伙伴捧場,清華大學(xué)副校長,以及眾多清華教授也都在融資現(xiàn)場站臺。因為深鑒具有濃厚的“清華DNA”。創(chuàng)始團(tuán)隊中,姚頌、汪玉,韓松等,均為清華校友。

股東及出資信息

工商信息顯示深鑒股東及出資信息如下表所示。姚頌是大股東,未被稀釋前持股比例24.12%;汪玉是第二大股東,未被稀釋前持股比19.60%;韓松持股10.34%。

房叔話安防 之 深鑒科技姚頌要扛起深度學(xué)習(xí)的大旗 - 張新房 - 張新房的博客 - AI+安防

產(chǎn)品和解決方案

房叔話安防 之 深鑒科技姚頌要扛起深度學(xué)習(xí)的大旗 - 張新房 - 張新房的博客 - AI+安防

在了解深鑒科技的產(chǎn)品線和解決方案之前,需要先了解深度學(xué)習(xí)。深度學(xué)習(xí)分為訓(xùn)練(Training)和應(yīng)用(Inference)兩部分,深鑒科技主要解決應(yīng)用問題。簡單來說就是企業(yè)將自己的深度學(xué)習(xí)算法模型訓(xùn)練好之后,由深鑒科技將其壓縮20-50倍并編譯,最終產(chǎn)品以板卡形式呈現(xiàn)。

深鑒科技基于的是FPGA平臺:與擅長訓(xùn)練的GPU相比,F(xiàn)PGA功耗更小、整體性價比更高,更適合用于應(yīng)用。但是由于FPGA的開發(fā)難度高、周期長,因此很多公司不愿使用。深鑒科技相當(dāng)于給用戶提供了一個黑盒子,企業(yè)只需要提供輸入模型和數(shù)據(jù),由深鑒科技提供應(yīng)用層的FPGA解決方案。

2017年,深鑒科技著眼于智慧城市與智能數(shù)據(jù)中心兩大市場,通過包括板卡模組、FPGA、編譯器、深度壓縮等在內(nèi)的完整解決方案,讓用戶輕易地將人工智能能力植入到大大小小的產(chǎn)品中。

2017年,深鑒科技發(fā)布了六款產(chǎn)品。分別為視頻結(jié)構(gòu)化解決方案(DP-2100-O16)、人臉分析解決方案(DP-2100-F16)、人臉檢測識別模組(DP-1200-F1)、深鑒Aristotle架構(gòu)平臺、深鑒深度學(xué)習(xí)開發(fā)SDK(DNNDK,Deep Neural Network Development Kit)以及深鑒語音識別加速方案(DP-S64)。其中前五款均為視頻監(jiān)控應(yīng)用及相關(guān)解決方案。其中DNNDK是深鑒科技面向AI異構(gòu)計算平臺DPU(Deep-Learning Processor Unit,深度學(xué)習(xí)專用處理器)自主研發(fā)的國內(nèi)首款原創(chuàng)深度學(xué)習(xí)開發(fā)SDK。深鑒CEO姚頌表示,DNNDK能極大降低DPU平臺深度學(xué)習(xí)應(yīng)用開發(fā)門檻和部署難度,并大大縮短算法部署到硬件的周期,提速AI產(chǎn)品研發(fā)過程。“DNNDK是國內(nèi)首個深度學(xué)習(xí)開發(fā)套件,可以對標(biāo)英偉達(dá)TensorRT。”

深鑒的產(chǎn)品和解決方案大體包括以下部分(不限于):

智能安防:智能IPC-深度學(xué)習(xí)加速模塊、智能NVR/DVR-深度學(xué)習(xí)加速模塊、視頻結(jié)構(gòu)化服務(wù)器-深度學(xué)習(xí)加速卡、人臉檢測識別模組DP-1200-F01、硬件架構(gòu)-亞里士多德ARISTOTLE架構(gòu)平臺、硬件架構(gòu)-笛卡爾架構(gòu)

智能大數(shù)據(jù):語音分析-LSTM加速卡、圖像分析-CNN加速卡

智能機(jī)器人:嵌入式端圖像處理-深度學(xué)習(xí)加速模塊

軟件:深度學(xué)習(xí)開發(fā)SDK DNNDK

解決方案:人臉分析解決方案DP-2100-F16、人臉識別平臺、SoC“聽濤”芯片、“雨燕”深度學(xué)習(xí)處理平臺、DP-S64語音識別加速方案、基于FPGA平臺DPU產(chǎn)品開發(fā)板

深鑒戰(zhàn)略

姚頌在一次接受采訪的過程中曾經(jīng)透露過公司的戰(zhàn)略,著重解決AI中一些產(chǎn)品化的問題。首先是分析方面,研究與分析深度學(xué)習(xí)算法的計算與存儲上的特征(Pattern)。其次是設(shè)計方面,利用這些深度學(xué)習(xí)算法的特征,設(shè)計針對于神經(jīng)網(wǎng)絡(luò)的壓縮方法、設(shè)計DPU體系結(jié)構(gòu)、并且設(shè)計對應(yīng)指令集,使得DPU能夠支持各類深度學(xué)習(xí)算法。第三是應(yīng)用方面,打通從算法到硬件的全流程,用軟硬件協(xié)同設(shè)計達(dá)到最好效果,并且開發(fā)好用的壓縮編譯工具,讓所有人都能夠方便的使用DPU產(chǎn)品。最后是協(xié)同優(yōu)化與迭代,針對實際應(yīng)用的算法模型,進(jìn)行DPU體系結(jié)構(gòu)的評估,發(fā)現(xiàn)算法中不適合加速部分,再對于算法與體系結(jié)構(gòu)進(jìn)行優(yōu)化或調(diào)整,使得應(yīng)用中全系統(tǒng)性能進(jìn)一步提升。

姚頌還表示:“深鑒科技是一個深度學(xué)習(xí)解決方案的提供商,而非一家只是賣芯片的公司。” 這樣的定位源于他對市場端的深度思考:“如果只是單獨(dú)做一個芯片公司,風(fēng)險非常高。因為周期比較長,資金消耗大,只有從一個單純的芯片走到一個系統(tǒng),再到一個解決方案,公司的前景才會更廣闊一些。”

目前,深鑒定位為安防、數(shù)據(jù)中心等行業(yè)提供完整的人工智能硬件模組與配套軟件。同時不斷加強(qiáng)在安防領(lǐng)域、數(shù)據(jù)中心領(lǐng)域上的產(chǎn)品研發(fā)和市場銷售。既然定位為平臺提供商,深鑒提供DPU平臺、編譯器與壓縮為一體的開發(fā)環(huán)境,供第三方在此基礎(chǔ)上搭建自己的算法以及解決方案。

深鑒始終堅持一個觀點(diǎn)認(rèn)為帶寬一定是一個最核心的問題需要解決。而傳統(tǒng)堆帶寬的方式一定會在造價和將來實際物理帶寬層面遇到一些瓶頸,所以深鑒科技把軟和硬結(jié)合在一起來做。先在軟件上做壓縮,然后在硬件上針對壓縮的神經(jīng)網(wǎng)絡(luò)做一個專用體系結(jié)構(gòu)的優(yōu)化。目前在這條技術(shù)路線上的公司還非常之少,但陸續(xù)開始有公司注入跟進(jìn)這個領(lǐng)域。而深鑒進(jìn)入很早,擁有先發(fā)優(yōu)勢,而AI目前屬于分散的細(xì)分市場,市場足夠大使得每個方向的創(chuàng)業(yè)者都可能獲得巨大的成功,隨后可能會出現(xiàn)產(chǎn)業(yè)整合和合并,那是多年后的事情了。深鑒科技更像一個制作Drive PX2的英偉達(dá),所有的產(chǎn)品都是針對于某個行業(yè)的方案,用戶最終看到的是一個板卡,它支持的東西一樣,只是性能和功耗不同,包含一些推理、設(shè)計和算法,用戶還可以自行開發(fā)。

那么,深鑒未來會不會布局AI手機(jī)市場呢?A+輪投資三星領(lǐng)投已經(jīng)給出了部分答案,作為數(shù)量級最大的芯片使用設(shè)備,手機(jī)似乎正在迎來越來越多的AI應(yīng)用。姚頌認(rèn)為,手機(jī)里做深度學(xué)習(xí)的應(yīng)用肯定會特別特別多。至于如何布局,姚頌表達(dá)了自己的看法:“我覺得手機(jī)里面提供的計算力是有限的,真正要去做到很精細(xì)的對于場景的理解或者分析等等,還是需要更大的計算力。所以很多廠商經(jīng)常會將一些事情傳到云端,再做更細(xì)致的分析,而AI應(yīng)用方面,以后云和端一定是配合的,不會完全限制在手機(jī)里。” 至于深鑒-聽濤芯片有沒有可能布局在手機(jī)端,姚頌表示有希望。他說,首發(fā)的聽濤芯片功耗大概在1.1W,幾T的數(shù)字芯片,這個芯片可以裁剪到適合更低功耗的場景,比如說物聯(lián)網(wǎng)芯片的功耗通常是在100毫瓦以下,手機(jī)里面是100到500毫瓦,在安防里面我們希望它是1瓦。至于未來深鑒會不會為三星手機(jī)打造AI芯片,姚頌并沒有給出答案。

已經(jīng)在安防領(lǐng)域扛起人工智能深度學(xué)習(xí)大旗的姚頌,我們期盼深鑒可以走的更遠(yuǎn),拭目以待。

更多的信息,請下載深鑒科技深度分析報告,文后下方附有下載鏈接,pdf格式文件,41頁。https://zhang.xin.fang.blog.163.com/blog/static/390570201814101224831/


版權(quán)聲明
本文由智客號作者上傳并發(fā)布,智客號僅提供信息發(fā)布平臺。文章僅代表作者個人觀點(diǎn),不代表千家智客立場。

相關(guān)推薦

評論文章

全部評論(0)

房叔話安防

房叔,真名張新房,人稱“房叔”,17年視頻監(jiān)控和安防行業(yè)經(jīng)驗,目前專注于視頻監(jiān)控、人工智能、計算機(jī)視覺技術(shù)。

格式j(luò)pg品質(zhì)60圖片即可
主站蜘蛛池模板: 德兰| 啊嗯啊| 电影白日梦2| 丰满妇女做a级毛片免费观看| 尼康相机型号大全和价格| 正常血压对照表| 电影处女地| 情剑山河| 年轻阿姨的性教育| 久久久在线视频| 健步如飞的蜗牛三年级作文| 布莱德·德尔森| 欲望之| 绝不放弃电影| 邓佳佳| 曹查理电影大全免费观看| 单人情侣头像| 金雪贤| 天地姻缘七仙女演员表| 守株待兔评课| 丰原功补| 拉雅| 毒鲨| 20岁电影免费完整观看| 孙颖莎结婚视频| 妇检被男医生摸到喷水| charlie sheen| 搞黄色的视频| 一路狂奔| 在线黄色片| 舞蹈压腿疼哭训练视频| 娟子演的所有电视剧| 免费头像图片女生| 台风电影| 公民的基本权利和义务教学设计| 意外的春天 电影| 下女们| 缺宅男女电视剧| 韩国电影诱惑| 拼音表大全图| 湖北卫视在线直播|