2019年杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋简短的介绍了阿里首款AI芯片含光800,这款当时最强AI推理芯片的一发布就引发了巨大关注,可谓高调亮相。

今年的阿里线上云栖有一个芯片设计发展现状与未来的论坛,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。

以宫颈细胞图片为例,配合高通量全场数字切片扫描仪,迪英加开发的D-PathAI能在5-10秒内自动完成宫颈细胞学初筛,系统判读的准确率可以达到95%以上。杨林表示,该平台的敏感性大部分都在99.5%以上,特异性基本上约80%左右。

含光800在三大AI应用中4-11倍的性能提升 

相对于含光800在去年云栖备受关注的亮相,今年云栖对含光800的关注度并不高,龙欣的介绍也只有15分钟,还包含了许多去年已经公开的消息。含光800的实际应用优势,应该是当下许多人关注的,但此次的分享给出的场景还没有十分丰富,介绍的也比较简单。这可能是由于目前紧张的贸易关系让阿里对于芯片相关的话题更加谨慎。

其次,和CT/X光影像数据相比,病理数据本来就少。国内的数据库更加不公开,多数存在“数据孤岛”的现象,大部分医疗数据存储于医院以及第三方检验机构,并且信息安全共享机制欠缺。另外,海量标准化数据积累下的算法也是AI病理诊断的关键一环。未来,谁有海量的数据以及更精进、鲁棒性更好的算法,谁就可能最早抵达“最后一公里”的终点。

借助AI在病理上的应用,研究人员能迅速精确地获取一段时间内切片的病变细胞数量、程度的数目及变化情况,观察出临床实验中的新药对病灶产生的影响。接下来,研究人员甚至能利用AI观察动物受药后的组织细胞变化状况用以指导药物研发。据杨林介绍,迪英加和阿斯利康中国在PD-L1人工智能检测的研发上已经展开了深度的合作。

AI在病理诊断中的应用主要包括:收集数据并标注,AI模型充分学习并对样本进行识别分析,输出辅助判读结果。其中在数据标注环节,需要病理专家进行高质量的标注,而AI模型会先高效区分阳性细胞密度较高的样本并进行精准识别。此外,AI还需选取一些可疑的局部切片给病理医生,做最后的复阅诊断。

深度优化CNN及视觉类算法

不过龙欣在昨天的分享中并没有提及含光800的峰值性能,而是强调其可用性。他表示,“含光800作为并没有在公开市场发售的芯片,通过阿里云输出。”

正如雷锋网(公众号:雷锋网)在去年的文章中所说,科技巨头自研芯片是因为有大量数据,在内部的AI需求推动下,希望通过自研芯片来提升效率和性价比。周五的线上分享中,龙欣也表示,阿里巴巴内部有广阔的AI应用,包括电商应用、视觉应用、语音交互、自然语言理解、机器翻译等。

据杨林介绍,迪英加将只针对医院采取模块化销售的方式:医院病理科可以选择购买最适合自己的模块,并能在未来扩充模块。“今年能覆盖到300家医院,明年能够覆盖到500-1000家以上的医院。”

即便充满机会,但不可忽视的是AI病理创业门槛颇高。首先它需要交叉学科背景,从迪英加的团队上就能看出这一点。杨林介绍,迪英加的团队基本上都是跨专业的复合人才。“不仅是懂计算机,你还要去懂生物和医学,特别是病理。”

高密度的计算与存储,极大减少I/O需求 软硬协同支持权重的稀疏压缩,计算的量化压缩

为了让含光800能够开箱即用,阿里云让购买实例的用户可以自动安装NPU驱动和SDK,系统方面支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,还预装主流深度学习框架,提供TensorFlow、MXNet示范教程。

昨天的分享中,龙欣给出的最新数据是,在行人检测应用中,4核含光800克支持100路视频,比主流GPU 25路的推理性能提升4倍。在车辆检测中,同样是4核含光800,可以支持85路视频,比主流GPU支持10路推理性能提升了8.5倍。

含光800未对外发售,性能通过阿里云输出 

法国LANVIN董事会主席及代理CEO 程云:现在中国的整个市场是我们的重点发展之一,是因为中国的市场现在恢复得特别快,然后我们的消费者的需求看得到非常明显的增长。

该书主编费尔南多·雷耶斯介绍,来自阿根廷、巴西、玻利维亚、哥伦比亚、智利、厄瓜多尔、古巴、墨西哥、秘鲁、萨尔瓦多、乌拉圭等11个拉美国家的22位专家学者,从自己所在国家的防疫政策及研究领域出发,在这本书中分析总结对疫情发展处理的得失,为下一阶段的疫情防控提出建议。同时,他们结合这一国际背景对中国和拉丁美洲国家的关系互动进行特别关注并对拉丁美洲未来与中国关系的发展进行展望。

但更应该看到的是,即便有强大的团队能够快速设计出一款芯片,但要大规模落地仍然需要很长的时间,这个过程软件发挥着更加直接的作用,获得客户的认可和采用也并非易事。阿里的芯片路,依旧还只是开始阶段。

历峰集团中国首席执行官 顾佳琳:我们上半年中国区的业绩是成长了78% ,也确实验证了说中国消费者对美好生活的向往,以及对于消费提升这样的意愿。所以我们也愿意不断地继续在中国市场上推陈出新。

据杨林介绍,病理星球主打大数据核心存储,主要存储数字病理切片。目前该平台共有90万例(一个病人为一例)病理样本,其中样本的数据标注主要由国内三级甲等医院的病理医生负责。“迪英加建立了严格的训练/测试数据质控流程,三个医生同时对一个病理切片进行诊断,如果三个医生同样判断为癌症,则标注为’癌症’。只要其中有一位不赞成,该切片就会被送至我们聘请的专家委员进行二次投票表决。”

ABB(中国)有限公司副总裁 潘瑛:从2018年开始,我们积极参与了每一届的进博会,利用进博会这一平台,我们的发布得到了政府媒体和用户的极大重视,也加速了我们产品在中国的应用。

除INT8/INT16量化加速外,也覆盖FP16/BFP16的向量计算除直接加速各种ReLu、 Sigmoid、Tanh等,也可支持未来新型激活函数

重复性工作、量多人少、效率较低是病理诊断的痛点。AI技术,特别是具有深度学习支撑的AI或让病理检查变得更智能也更简单:AI以迅速、标准化的方式处理数字化的病理切片,对病理切片进行自动勾画、识别,并以结构化的语言提出辅助诊断的建议。

墨西哥大都会自治大学政治文化系主任爱德华·孜立就墨西哥和中国的医疗体系进行了比较,指出了中国的制度优势、管理能力使得新冠疫情成功得到控制,拉美国家不仅仅要从技术上去学习中国,更应关注中国的国家治理、公共管理能力,并在中国—拉共体论坛框架下与中国加强对话。(总台记者 宫祥诚)

康宝莱中国区总裁 郭木:我们在中国上市了9款新的产品,我们对于中国市场充满了信心,我们也希望能继续扩大在中国的投资。

其次在齐全性上,迪英加以D-PathAI人工智能病理辅助诊断系统为核心,其产品覆盖了细胞病理、组织病理、分子病理和免疫组化四大模块内容。“这四大模块涵盖了病理科所有可能遇到的500多种不同的癌症检测,免疫组化和分子病理也将是我们未来发展的重点。 ”杨林解释道。

众多参展企业将进博会视作打开中国甚至全球市场的重要平台。

这次实验的每个步骤都可由AI提供决策依据,通过将医生的推理步骤模块化,从而模拟推理的过程。这是全球首篇发表在自然子刊上的关于讨论病理图像分析中的人工智能可解释性问题的专著。

一个典型的例子就是拍立淘,两千多万的日活用户在使用这项功能的时候,要透过一张图片,在4亿多的商品中搜索,在30多亿张图片多库中进行匹配,根据用户的使用习惯进行个性化推荐,这就需要很强的AI能力。

针对以上整个过程,迪英加开发了软硬一体化的D-Path系列产品组合、建设AI病理的整套方案。该方案包含了提供高压缩比例云存储解决方案的病理星球(D-PathPlanet)、高通量病理辅助诊断系统D-PathAI、国内首款智能显微镜智睫(D_CleverEye)等。

龙欣强调,含光800的应用主要是在数据中心和大型端上,以CNN类模型推理加速为主,可扩展到其他DNN模型中。目前在具体的应用中相比GPU有4-11倍性能提升。 

那么,阿里的下一代AI芯片会在什么时候推出呢?雷锋网

如今,进博会不仅是世界企业的舞台,也成为一面折射中国经济活力的镜子。为了配合企业新品发布的需求,本届进博会第一次设立了新品发布专区,从5日开始,已举办42场发布活动,发布91件新品,其中全球首发33件,亚洲首发30件,中国首发28件。

迪英加融资的脚步跑在国内同赛道企业的前面。据悉,目前国内专注AI病理的相关企业最快也只进行到了A轮。据杨林透露,迪英加将于今年年底或明年年初开启新一轮C轮次的融资。

有了标注好的样本,接下来就是AI模型对病灶的识别和分析,此时算法是核心。传统用深度学习算法多数是剪切切片,预测单张图块的肿瘤情况,但忽视周边区域会让结果产生较大误差。

更引人关注的是含光800在具体应用中的表现。

目前国内还没有一个AI辅助诊断的方案获批。迪英加正在积极探索申报病理AI诊断第Ⅲ类医疗器械注册证,杨林推测将在未来2-3年内获批。

云栖大会 | 阿里宣布全球最强AI推理芯片含光800问世,张勇、张建锋大谈数字经济

迪英加推出的智睫系统 D-CleverEye能实时读取显微镜下的视野,根据其公开资料,该系统通过AI算法进行分析,迅速给出提示,几乎无延迟。此外,迪英加还推出了远程病理互联系统D-PathConnect,帮助病理医生突破地域限制,进行分级诊疗。

丰富的模块成为迪英加撬动商业化的有力触角。自去年10月底,该公司的一系列产品如智能显微镜、各种款式扫描仪、病理诊断图像处理软件、病理科信息系统和远程会诊系统等软硬件产品在2019年10月陆续获得国家药品监督管理局(NMPA)批准上市,目前迪英加的产品已经进入158家医疗机构,其中80%是医院。

相对于影像检查的自动化,病理检查就显得有些古老,目前病理诊断的全程还主要依靠显微镜下人眼的观察。在肿瘤诊断上,临床医生对于患者做出的治疗措施,80%受病理学报告的影响。因此,病理医生也被称作临床诊断中“说最后一句话的人”同时也被称为“医生的医生”。

另外,很多客户能够在迪英加这里找到了一些偏小众化癌种的模块。杨林举了个例子:“有一家药厂来找我们看能否做做神经内分泌瘤的病理诊断,这是一个相对比较罕见的癌种,结果客户发现迪英加确实已经有开发完成的神经内分泌瘤的分析模块。”此外,迪英加还支持为用户提供一些定制化服务,比如不仅做简单的良性筛查,还能做肿瘤的分级和分型。

其中迪英加在细胞病理方向开发了20余个智能分析模块,可协助诊断胃癌、肺癌、膀胱癌、乳腺癌、肾癌、前列腺癌等癌症分型。在分子病理方面,迪英加能运用人工智能对探头液样品、血细胞以及像宫颈切片等进行判读。相比之下,国外同赛道企业AIPath和Paige AI约有十几个模块,目前也主要侧重于1-2个癌种的AI病理检测,比如乳腺癌。

智利外交学院院长胡安·索马维亚在发言中指出,在新冠疫情仍在拉美肆虐、未来尚不明确之时,拉美各国政府应该共同应对并应该思考疫情之后寻求什么样的发展模式。“拉美需要深化区域合作,加强与中国关系”。

还有,在直播、点播、短视频等视频质量增强中。4核含光800的直播视频增强性能为500 FPS,对比主流推理GPU的50 FPS,性能加速比是10倍。在点播HDR中,4核含光800多性能是66 FPS。龙欣说:“点播HDR需要用到性能比较强的训练GPU,比如英伟达A100,但即便如此其性能智能达到10 FPS,我们可以实现6.6倍的性能加速比。”

两位创始人在计算机视觉、深度学习和数字病理方向研究超过15年,其中杨林师从多位计算机视觉和病理学领域的世界级大师,包括数字病理学奠基人之一的David Foran、鲁棒性计算机视觉领域“教父级”的导师Peter Meer,以及生物信息学创始人美国科学院院士Casimir Kulikowski等。而迪英加背后的研发团队成员超1/3拥有海外博士学位,且多数拥有多个专业背景。

阿里首款AI芯片含光800重磅发布,全球最强AI推理芯片如何练成?

首先在通用性上,迪英加目前的产品有较广泛的适用性。比如D-CleverEye能兼容市面上几乎所有硬件厂商(病理产业链上游企业)的产品,比如国外莱卡生物、滨松光子学和国内的江丰生物、麦克奥迪医疗等全切片成像系统/设备。

他表示:“含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买,实例名称是ebman1.24xlarge,最多支持8核NPU和96核vCPU,384G内存,网络带宽最高达到30Gbit/s,主要面向数据中心的CNN类型模型推理加速,业务包括城市大脑,图像视频审核,拍立淘等。”

2020年世界病理学大会报告显示,预计到2024年,病理学市场规模将从2019年的303亿美元达到444亿美元,从2019年到2024年的复合年增长率为6.1%。具体到国内,据西部证券的预测,目前我国病理行业的潜在市场超 300亿元,其中细胞病理宫颈癌筛查潜在市场超200亿。

百亿市场风口,AI病理有机会也有挑战

也就是说,含光800的硬件特别针对CNN算法模型进行设计,但也保持一定的灵活性,再匹配全栈的软件支持在特定应用和算法中实现高性价比。去年张建锋发布含光800时说,“在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。”

整体化方案筑起竞争壁垒

杨林表示:“AI先做初筛,只把它判断不了的疑难病例交给医生看,这样可以有效的降低医生的阅片量,同时提升诊断的精确度。”正是看到了AI在病理领域的应用前景,以及将学有所长落地的强烈信念,2017年杨林决定辞去美国佛罗里达大学生物医药工程系终身教授和博导的职位,与美国罗格斯大学工业工程系副教授、生物医学工程系和计算机系博士生导师以及新泽西医学院兼职教授李康博士共同创立了迪英加,开启从学界到产业的创业之路。

资本对AI病理赛道的加持,不仅是看到了数字化病理的“蓝海”机会,也看到了它在新药研发领域的想象空间。

指令集支持可编程模型扩展

另外,AI病理还能拓展到一些癌症的早筛项目中,比如乳腺癌、宫颈癌。

迪英加的D-PathAI辅助诊断系统可对病理图像进行自动检测-识别-分割-判读:先对全场图像建立金字塔结构,然后对不同层级进行判读并充分考虑背景信息,模拟病理医生多尺度观察肿瘤区域的实际操作。据其官网介绍,其算法5s内能处理1亿像素,1分钟内即可完成分析15×15mm的细胞涂片/组织切片;该AI算法鲁棒性强(鲁棒性是指控制系统在一定参数摄动下维持某些性能的特性),能精准获取细胞定位等。

该书作者之一、玻利维亚天主教大学教授妮可·乔丹在发言中说,玻利维亚的疫情发展和抗疫措施与拉美其他国家具有很大的相似性,有很多教训和挑战。中国在国际抗疫行动上发挥了非常积极的作用,需要思考的是如何让中国在拉丁美洲的经济复苏方面起到更大的作用,比如在中国的人道援助和债务减免之上,如何支持重启拉美各国经济,改善条件不足的医疗体系。

本届进博会上,消费品展区就有很多新品发布。参展商表示,中国的消费升级红利远超预期。随着国内消费水平的提高,对于进口商品的需求日益旺盛,这为更多高品质的进口产品进入中国提供了可能。

肖特集团中国区总经理 陈巍:中国是目前最大的消费市场,我们非常看重,后期会不断加大投资。

在直播、短视频、商品信息流等内容识别应用中的ResNet50 V2模型中,含光800(4核)的帧率可以达到20000 FPS,比主流推理GPU的1800 FPS性能提升11倍,性能加速比11倍。在Inception V4模型中,含光800(4核)的处理帧率达到5000 FPS,比主流推理GPU的460FPS性能加速比高10.8倍。

因此,阿里希望通过自研的含光800从硬件到软件的方案提升性价比。做个简单的回顾,含光800在硬件方面有三个方面的特色,包括:

早在几年前,该赛道可观的市场潜力吸引了资本的注意,近几年它们占领标的企业的动作愈发频繁。2017-2020年,3年间已有近40起融资事件,且有逐年递增的走向。目前,AI病理国外企业融资最快的已到B+轮。

阿里云异构计算产品研发总监龙欣

至于在语音交互、自然语言理解等语言方面的应用实例优势,龙欣并未在今年的云栖上给出数据。

谈及迪英加的优势,杨林认为其产品矩阵为下一代数字化病理科提供了一整套的解决方案,在通用性和齐全性上有较高的竞争壁垒。

去年含光800发布时给出的数据是,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。

雷锋网原创文章,。详情见转载须知。

谈及AI病理是否会替代病理医生,杨林表示否定。“我不认为(AI病理)最终是要去取代病理医生。医疗的所有产品都是医生的工具,提高工作效率和准确率,辅助做出判断,更好地为广大的癌症患者提供更优良和精准的服务。”

中国国际进口博览局招商处处长 王宏伟:整体上是非常好的,现场气氛比较热烈,而且出现了排队入场的情况,很多参展商在新品发布之后就直接表示,说我们进一步坚定了参与进博会的信心,也进一步坚定了融入中国市场的信心。