导航菜单

澎峰科技张先轶:做嵌入式AI工业级领域落地先行者

负责人:奇峰科技用三年时间研发自己的技术产品,并在商业道路上积极探索。下一步很明确:加速着陆,生产嵌入式AI领域的最佳产品,并成为第一个工业产品供应商。

img_pic_1559028306_0.png

与青少年,科学家和企业家一起玩,如果你在过去的20年中给张先宇的生活贴上一些标签,这似乎是他身上最生动的关键词。从游戏开始,对代码的痴迷,大学对计算机科学的选择,国外研究生学习以及开源矩阵库OpenBLAS的先驱,他现在是一家名为PerfXLab的公司的创始人。 CEO。

该公司近年来专注于流行的嵌入式AI,其产品基于ARM/FPGA/GPU/RISC-V等终端平台的技术解决方案,包括应用算法,框架,性能库,硬件板等。它可以应用于不同的场景,如手机,无人机,智能旅行,安全等。

行业共识:商业化的能力可以最好地反映技术项目的商业价值。作为智能领域的先锋,奇峰科技自2016年成立以来,从未停止升级和探索其产品和业务路线。

在过去三年中,从最初希望嵌入人工智能的软件到现在的软件和硬件集成解决方案,从最初提供的“铲子或砖头”,到现在可以提供“桥梁或“随着人工智能应用领域产品和技术的逐步成熟,奇峰科技的市场意识和商业发展进入了快车道。

在知识产权研讨会和张先玉的四个多小时的访谈中,你会发现他不是一个“擅长讲故事的人”。他更像是一个学者的严谨和简单。与高峰的优势相比,他更多地谈到了行业的现状以及如何突破瓶颈。

目前,为了公司的使命,他多次强调“加速商业化”,为个体开发商提供工业级产品登陆和生态开发。

今天,从安全到航空航天,Pinnacle的产品已经开始在各种情况下进行测试,预计到2019年底将实现盈亏平衡。但目标不是停在这里。下一步:加速着陆,在嵌入式AI领域生产最好的产品,并成为第一个工业产品供应商。

加入嵌入式AI

在高年级(2005年),通过一场比赛,张先宇和嵌入式AI“相互联系”。

微软举办了一场名为“超越边界的超越边界”的(Windows Embedded Student ChallengE竞赛)主题。这是一场团队战,4名本科生,2名研究生,根据不同主题的不同发展。设计。张先宇得到了嵌入式系统的主题。他们的想法是在超市购物车上建立一个交易系统并应用人脸识别技术。

在中国大陆,前30名中选出10组,张贤浩的队伍就在其中。虽然他们没有在那场比赛中获奖,但他们第一次访问了微软总部,并在欢迎晚宴上看到了组织者演讲嘉宾比尔盖茨的张先宇。愿景已经开启。这一经历也为他未来在美国的学习奠定了基础。

2005年,张先宇从本科毕业并获得保险,并继续在北京理工大学实习计算机科学。 2006年,他再次与原来的小伙伴《第三届趋势科技百万程序竞赛》一起参加了团队,主题是网络安全,来自10支队伍中的350支队伍的初步团队,张先义的Collapsar团队就在其中,他最终获得了冠军并且还获得了多个个人奖项。

对于张先宇而言,除了获得丰厚的奖金和体验技术与现场的实际结合外,更大的回报是对技术领域的信心。

2007年毕业于硕士学位后,张先宇进入中国科学院软件系,从事高性能计算,性能优化和矩阵计算。 2011年阅读期间,中国科学院软件研究所助理研究员张先宇带领团队创建了开源矩阵计算库 OpenBLAS,他自己也是该项目的主要维护者。在矩阵计算的细分中,这是一个高质量的开源项目。

OpenBLAS被认为是业界领先的开源矩阵计算库,支持几乎所有主流CPU处理器和通用操作系统,同时实现更好的性能优化。它在2016年获得了中国计算机学会科技进步二等奖,并进入了许多主流Linux安装包。例如,Ubuntu包含OpenBLAS包。

此外,OpenBLPC也用于OpenHPC套件中。其广泛的用户,从开源项目Julia语言,GNU octave,到深度学习mxnet,Caffe,甚至小发猫,ARM,Nvidia和其他公司,也在他们的产品中使用OpenBLAS。 “特别是许多嵌入式AI库已经调整了我们的OpenBLAS。”总的来说,兼容处理器和支持的操作系统的范围是开源库中最广泛实现的。

2014年从张先义博士毕业后,他了解到,开发TOP奥斯汀以前的GotoBLAS的团队有机会互访,所以他提出了去美国的想法。在这一点上,深度学习和人工智能逐渐变得热门。

2016年,张贤浩前往麻省理工学院继续深造。巧合的是,在麻省理工学院 - 中国企业家论坛上,张先宇会见了深圳景泰科技的创始人温家豪,并将他介绍给国内的AI企业,这也加强了他创业的决心。

当时,人工智能已经真正进入公众视野,深度学习算法已成为人们关注的焦点,而计算机视觉识别领域也开始在风险投资行业中受到追捧。张先宇决定离开麻省理工学院并返回中国。 2016年底,PerfXLab成立。

不久之后,PerfXLab获得了Zi Niu Fund和Ming Shi Capital的天使融资。张先宇也完成了生活中的身份转换。

寻找业务场景

在人工智能逐步探索商业化的道路上,人们逐渐发现,实现技术,不仅算法模型的优越性能和可靠的硬件支持,而且还结合了AI技术和硬件环境,然后应用到现实生活中为了满足用户需求。

为此,奇峰科技在过去三年中一直致力于发展自己的技术,从最初的嵌入式人工智能意图到现有的软硬件集成解决方案,已成为国内嵌入式AI工业级。第一个在该领域着陆的供应商。

在框架层面,奇峰科技推出了轻量级深度学习推理框架InferXlite,该框架支持ARM CPU,ARM Mali GPU,AMD APU SoC和NVIDIA GPU。与现有的传统通用框架相比,它具有体积小,重量轻,速度快的优点。代码< 100k,界面支持任何网络模型,可以移植任何硬件平台,几乎没有依赖库,框架设计和性能加速分离,从框架层面给予足够的考虑加速算法。

基于OpenBLAS的成功经验,该团队为嵌入式平台(如ARM)的深度学习卷积算法优化创建了PerfBLAS。它可用于移动平台,移动电话,机器人,无人机等。提供的主要功能是启用深度学习模型。在这些硬件平台上更顺畅地“运行”。因此,该公司的大部分初始客户都是手机制造商或手机相关的软件服务提供商,如莫莫,360,都是他的客户。

“寻找手机厂成为手机的一部分”是奇峰科技2017年最重要的任务之一。但很快,张先义意识到仅仅是一家软件服务提供商是不够的。他一直在想:“我们可以扩展的商业模式是什么?”

到2018年,张先义发现客户的需求发生了变化,更多的是硬件和软件相结合的方向。 “这是一个很大的变化,其背后意味着可能会有一些更好的定价(商业)模式。”

张先玉做了这样一个比喻。在此之前,奇峰科技提供的服务更像是一把合适的铲子或砖头。 “但面对更多的客户,你需要提供一座桥梁或一座房子。这对于我们来说,我们需要能够整合更多东西的产品。”

因此,基于核心软件框架和多个计算库,奇峰科技集成了集成硬件产品:嵌入式深度学习开发平台PerfBox,Perf-FPGA,Perf-APU和Perf-V工程板。

PerfBOX使用64位ARM处理器,并集成了InferXLite和PerfBLAS等软件套件,用作学习,开发和部署深度学习应用程序的平台。 Perf-FPGA和Perf-APU分别是FPGA平台和AMD嵌入式GPU平台的深度学习应用程序部署平台。

Perf-V工程板是由Qifeng Technology为RISC-V开源社区设计的FPGA开发板。它具有极大的灵活性,移植了各种RISC-V处理器架构,并配备了丰富的学习资料,为RISC-V处理器设计和FPGA产品开发提供了良好的实验平台。

市场反馈和需求的变化证明了奇峰科技软件和硬件选择的产品路径决策符合当前的消费需求。

例如,张先启在2018年的一次展览中,他的团队带来了一些基于ARM的硬件产品。 “该行业的兴趣程度明显不同于我们之前的软件演示。”

他还意识到嵌入式软件单独出售并不容易。它使用的人少,单价低,难以处理。但是当软件在硬件上运行时,用户可以在产品为时触摸该产品。或者盒子,软件的附加值也可以有最大的体现。

另一个变化是,张先浩发现手机厂商的集中度越来越高,这也预示着与客户的合作需要不断寻找新的增长点。

新的未来

在增长过程中,奇峰科技的产品路径也从原来的纯软件发展到现在的“软件+硬件+算法”组合厚模式,围绕ARM,FPGA/DSP,GPU,三个技术方向力和FPGA是它的核心路径并已商业化。

与三个技术方向相比,ARM具有相对较强的事务管理功能,可用于运行接口和应用程序等。其优点主要体现在控制方面。

在一段时间内,ARM曾占据过90%的市场份额。最初的峰值技术技术路线基于ARM开发,其硬件产品用于安全领域或某些工业级场景。但是慢慢地,张先浩发现FPGA和AI的结合正在上升和强劲。

FPGA和DSP均可应用于工业级产品,具有高实时性和对环境的广泛适应性。在此基础上,奇峰科技的核心产品Perf-FPGA开始在面部,行人,车辆等物体,物体检测和跟踪等场景中进行部署和使用,支持无人机,安全,科学等应用。研究。

Perf-FPGA涵盖了基于FPGA部署平台的深度神经网络算法压缩,定点量化和生成加速器。压缩和量化工具DL-Quants可以导入各种主流深度学习模型,DL-Compiler可以快速生成DL加速器并运行代码。 DL-Accelerator在RTL中实现,底层针对不同平台进行了调整和优化,以最大限度地提高资源利用率和性能。

张先浩团队已将其产品应用于航空航天领域,如无人机,野战卫兵等。“我们遇到了潜在客户,产品被放置在自然保护区内。”就像一个电子警察的眼睛,快速识别进入相应区域的车辆或人员,这对产品来说是一个很大的挑战。现场环境复杂,供电难度系数大,环境多变,产品要求可靠性高。

张贤伟强调,该产品的一大特色是对复杂场景的高速识别。的检测速度高达每秒70帧。 “有必要快速确定哪种车辆,人员等。能够达到这个水平是非常好的。”简单。“在一个业务领域,奇峰科技及其合作伙伴共同开发并提供了可行的解决方案。目前,产品已进入市场应用和测试阶段,经过市场反馈,他们很快就会进入批量生产。

在FPGA实现的基础上,DSP相关技术产品已经成熟并加速布局,嵌入式GPU也与AMD合作。

显然,在国内工业级智能产品领域,奇峰科技是第一家率先将产品推向前沿的企业。在这个市场中,“规模将是1000亿元的巨大蓝海。”奇峰科技迈出了第一步。从研发到销售产品需要几年的时间。现在,这无疑会给后来者带来一定的市场压力。

与此同时,奇峰科技正在为个人开发人员开发FPGA AI平台。 “这相当于一个FPGA的开发版本。”张先宇说,“这将有助于客户,增加市场容量。越早了解我们的技术,我们就能越早使用我们的解决方案。“/p>

此前,在该领域,该公司最大的竞争对手是神剑科技。在2018年下半年,全球最大的FPGA制造商Xilinx收购了它。 Shenjian Technology成立于2016年,一直致力于开发基于Xilinx技术平台的机器学习解决方案。深见技术引入了深度学习处理器的两种基础架构,即亚里士多德的架构和笛卡尔架构。 DPU产品基于Xilinx FPGA器件。

通过神经网络与FPGA的协同优化,神剑科技为安防,数据中心,汽车等领域提供了经济高效的嵌入式和云推理平台。这就是丰丰科技一直在做的事情。

深入收购神剑科技足以证明FPGA在该领域的市场空间和巨大前景。这对张先浩的团队来说也是一个很好的远见:在受到Xilinx的深深约束后,一些先前的见解科技客户将寻求新的供应商,奇峰科技在不久的将来迅速发展和部署。它无疑已成为该业务领域的领先技术,也是第一个实现工业级场景快速商业化的技术。

为此,丰丰科技不断获得资本的认可和祝福。张先宇透露,经过前A轮融资,预A +轮融资将在不久的将来完成,这将继续增加工业级应用的应用和开源平台/社区的发展个别开发者。输入和扩展。

“渗透客户需求的情景是我们必须继续这样做。在此基础上,我们将继续迭代升级并创造我们自己的商业障碍。”张先宇说。