官方动态
【下载】深度学习计算机视觉:使用 Python 和 Keras 的神经网络架构 【设计】50W超强超级无敌超牛X强光LED探照灯户外照明吊打山力士C1500 大联大有奖直播:最新功能安全牵引逆变器方案:助力汽车提升续航与节省成本!预约有礼 转发展会信息有奖 领先电源和感知技术如何助力未来汽车,请到上海AMTS W4-E24展台了解一下! 【11月21日 KEE大师云课堂】第十一期:40
【下载】深度学习计算机视觉:使用 Python 和 Keras 的神经网络架构
【设计】50W超强超级无敌超牛X强光LED探照灯户外照明吊打山力士C1500
大联大有奖直播:最新功能安全牵引逆变器方案:助力汽车提升续航与节省成本!预约有礼
转发展会信息有奖 领先电源和感知技术如何助力未来汽车,请到上海AMTS W4-E24展台了解一下!
【11月21日 KEE大师云课堂】第十一期:400 G/CEI 4.0表征和一致性测试
不用等到 2045 年,现在你就可以造一个 Oasis 《头号玩家》观后感

作为现阶段应用与变现速度最快、最受关注的人工智能技术,计算机视觉已经到了一个爆发的时代。目前,计算机视觉正在带动全球新一轮的市场热潮。
机器人文明君以国内外应用计算机视觉技术的巨头和创业公司为主体,针对计算机视觉技术发展的关键节点、市场现状及应用场景进行分析和研究。
1982年马尔( David Marr )《视觉》(Marr, 1982)一书的问世,标志着计算机视觉成为了一门独立学科。计算机视觉是机器认知世界的基础,也是最主要的人工智能技术之一,到现在已经历经40多年。
人类认识了解世界的信息中91%来自视觉,同样,计算机视觉成为机器认知世界的基础,终极目的是使得计算机能够像人一样“看懂世界”。目前计算机视觉主要应用在人脸识别、图像识别方面(包括静态、动态两类信息)。
人脸识别是人工智能视觉与图像领域中最热门的应用。 去年 2 月,《麻省理工科技评论》发布“2017 全球十大突破性技术”榜单,来自中国的技术“刷脸支付”位列其中。
目前,人脸识别技术已经广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗等行业。该技术已具备大规模商用的条件,未来三到五年将高速增长。而今年,这一技术有望在金融与安防领域迎来大爆发。
人工智能技术可以对结构化的人、车、物等视频内容信息进行快速检索、查询。这项应用使得让公安系统在繁杂的监控视频中搜寻到罪犯的有了可能。在大量人群流动的交通枢纽,该技术也被广泛用于人群分析、防控预警等。
视频/监控领域盈利空间广阔,商业模式多种多样,既可以提供行业整体解决方案,也可以销售集成硬件设备。将技术应用于视频及监控领域在人工智能公司中正在形成一种趋势,这项技术应用将率先在安防、交通甚至零售等行业掀起应用热潮。
静态图片识别应用热度在视觉与图像领域中排名第三。将人工智能技术单纯用于图片识别分析的应用企业数量并不如预想的多,主要原因有以下四个方面:
a、目前视频监控方向的盈利空间大,众多企业的注意力都放在了视频监控领域;
b、人脸识别属于图片识别的一个应用场景,做人脸识别的大多数企业同时也在提供图片识别服务,但是销售效果不佳,主要赢利点还在于人脸识别;
随着汽车的普及,汽车已经成为人工智能技术非常大的应用投放方向,但就目前来说,想要完全实现自动驾驶/无人驾驶,距离技术成熟还有一段路要走。
不过利用人工智能技术,汽车的驾驶辅助的功能及应用越来越多,这些应用多半是基于计算机视觉和图像处理技术来实现。
三维图像视觉主要是对于三维物体的识别,应用于三维视觉建模,三维测绘等领域。
机器视觉可以快速获取大量信息,并进行自动处理。在自动化生产过程中,人们将机器视觉系统广泛地用于工况监视、成品检验和质量控制等领域。
机器视觉系统的特点是提高生产的柔性和自动化程度。运用在一些危险工作环境或人工视觉难以满足要求的场合;此外,在大批量工业生产过程中,机器视觉检测可以大大提高生产效率和生产的自动化程度。
医疗数据中有超过 90% 的数据来自医疗影像。医疗影像领域拥有孕育深度学习的海量数据,医疗影像诊断可以辅助医生,提升医生的诊断的效率。
计算机文字识别,俗称光学字符识别,它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。这是实现文字高速录入的一项关键技术。
2016 年,Google 举行了一场人工智能作家的画展。通过一个名叫DeepDream的艺术生成器,谷歌可以将神经网络由内部传送到外部。不是识别图像,而是创作图像。有人称这些机器做的画为机器之梦。
以上介绍是当前市场关注度、渗透率以及技术采用度相对较高的应用场景。不过,当前的应用仅是冰山一角,未来的前景明显更加广阔。IDC认为全球计算机视觉技术的应用在2017年的渗透率仅为8%,而到2021年渗透率将达到12%。
Analys易观认为,计算机视觉还将逐步拓展服务和工商业等多重应用场景。如下图:
计算机视觉技术已经步入应用早期阶段,不仅渗透到传统领域的升级过程中,还作为最重要的基础人工智能技术参与到前沿创新的研究中。
从计算机视觉技术对传统行业的影响来看,计算机对静态内容的识别应用主要体现在搜索变革和照片管理等基础服务层面,意在提升产品体验;伴随内容形式的变迁(文字→图片→视频),动态内容识别的需求愈加旺盛,安全、娱乐、营销成为最先落地的商业化领域。
安防是环境最为复杂的应用领域,计算机视觉的应用从软硬件两个层面优化安防人员的作业效率和深度。
安防的应用场景以识别犯罪嫌疑人、目标车辆(含/假牌车)以及真实环境中的异常为主。
传统安防产品主要功能在于录像收录,只能为安防人员在事后取证的环节提供可能的线索,且需要人工进行反复地逐帧排查,耗时耗力;智能安防则是将视频内容结构化处理,通过大数据分析平台进行智能识别搜索,大大简化了工作难度,提高工作效率。
除此之外,在硬件层面上,传统安防产品超过4-5米的监控内容通常无法达到图像识别的像素要求,并容易受复杂环境中光影变化和移动遮挡的影响而产生信息丢失,因此计算机会出现大量的误报漏报,这些局限为治安工作造成了一定的阻碍。
安防技术厂商在此基础上进行了创新,开创了三维计算机视觉的应用,通过整合各类传感器达到类人眼的效果,减弱了环境对信息采集的负面影响,提高复杂环境下的识别准确度。
Analysys易观认为,计算机视觉的应用从行业痛点出发,以软硬件的方式大大优化了安防人员的作业效率与参考深度,是顺应行业升级的利好。不过,在实际应用过程中,对公安、交警、金融等常见安防需求方而言,更强的视觉识别效果往往意味着更多基础成本(存储、带宽等)的投入。
安防厂商的未来将不只以技术高低作为唯一衡量标准,产品的实用性能与性价比的平衡才是进行突围、实现量产的根本,因此市场除了有巨大的应用空间外,还会引发一定的底层创新。
直播平台的爆红丰富了网民的娱乐生活方式,产生的海量内容也为平台的监管造成了巨大的压力,传统人工审核效果不稳定,基于深度学习的图像识别平台可以有效缓解这一痛点,同时也可对前端的内容运营进行优化,提高用户体验和活跃度。
Analysys易观认为,直播平台为计算机视觉创造了新的应用场景,伴随行业的发展,除刚需之外,平台定制化、差异化的需求也会为计算机视觉应用提供更多的增量空间。另外,与直播的UGC性质类似,其他的应用场景还有长短视频平台、社交平台、云存储平台、CDN以及社区平台。
挖掘视频中广告位及视频电商购物一直是视频平台作为中间方探索营销创收的新方式,此前以人工贴标、投放的方式实现,因效率低下仅作为小范围试水。
Analysys易观认为,计算机视觉将加速这一探索的进程,除技术成熟度之外,用户体验和用户习惯(从PC端向移动端迁移)也是对应用程度比较重要的影响因素,需要合理设计及长期培育。
根据Analysys易观,国内技术主要沿袭国外,但国内创业环境和应用场景更为宽松,市场空间不容小觑。
国内外巨头则一方面利用资源优势积极进行底层架构建设,并将技术广泛应用到已有的产品升级中,另一方面利用资金优势大量收购优秀的技术和数据创业公司,迅速弥补技术短板、数据短板和人才短板。与此同九游体育时,巨头们还热衷于创新前沿产品的研发,以及搭建开源平台帮助创业公司迅速起步,持续不断地提升业内影响力。
国外巨头自研和收购双管齐下布局,将视觉技术广泛应用于自身产品升级,并基于自身基因打造技术服务平台和新品类持续提升影响力。
2、计算机视觉创业投资成本巨大,行业壁垒高,对行业通电的洞察以及产品性价比的控制是影响商业变现的关键因素;
5、实际应用的价值以提升效率为主,并非取代人类,而是辅助作用,从业者需管理市场预期,耐心培育市场。
总的来说,计算机视觉创业公司想要生存并持续赢利,必须具备 “技术持续进步+工程化能力(量产)+产业化能力(服务)”的三合一核心竞争力,缺一不可。只有和场景合作方形成强势资源的深度绑定,透彻解读场景需求,才能发挥计算机视觉在行业创新中的真正价值,从而避免成为PPT公司,最终在行业内获得持续赢利能力,只有稳定持续的营业收入才能切实证明公司的商业化能力。
可以预料的是,2018年,计算机视觉公司不论大小,竞争的关键不再是算法刷了几个榜单,发了多少篇论文,而是将技术应用到不同行业场景的能力,凭借对真实业务需求的深刻理解和强大的落地服务能力。