格灵深瞳：让计算机看懂世界

2017年01月23日 11:10 来源：网络传播杂志

深瞳人眼摄像机Foveacam是首款基于人眼工作原理的摄像机，可以达到2亿像素动态瞬时分配，在50米内可以展现清晰的可识别人脸，100米内看清全身特征，摄像机视角达到了70度。图/本刊记者潘树琼摄

　　颐和园腹地的红墙四合院，河水凉亭，满目古色。抬头一看，“格灵深瞳”四个字组成的牌匾，特别显眼。若不是提前知晓目的地，笔者一定不会相信这古香古色的四合院里，居然装着一家致力于计算机视觉研究的人工智能科技公司。

　　比尔·盖茨认为IT界的下一个大事件是计算机视觉与深度学习的结合。2014年6月中旬比尔·盖茨访问北京时，他到访的第一家创业公司便是格灵深瞳。格灵深瞳创立于2013年4月，是一家将三维计算机视觉和深度学习技术应用于商业领域的科技公司。格灵深瞳的“野心”是让计算机看懂世界，事实上，教机器看懂这个世界，从很多年前开始就有人持续致力在做了，只不过采用的大多是“摄像头+强算法”的理论框架。Google、百度等巨头同样在做，不同的是他们还是偏重搜索、社交；但格灵深瞳想做的是“第一个将计算机视觉商业化的公司”，而切入智能安防监控领域是第一步。

　　本刊专访格灵深瞳联合创始人、CTO赵勇，他曾供职于Google总部研究院，是Google Glass最早期的核心研发成员。让我们看看他眼中的计算机视觉发展到了什么程度？人工智能又将如何发展？

　　人工智能为计算机视觉赋予智慧的光芒

　　《网络传播》：第三届世界互联网大会上举行了一场领先科技成果发布活动，多数事关人工智能，且该词被参会嘉宾频频提及，你是否觉得，人工智能发展的最好时机已经到来？

　　赵勇：跟过去三四十年相比，现在肯定是最好的时机。人工智能已经发展到了一定程度，开始为社会提供具有商业价值的产品和服务，现在各大企业纷纷投入研发。但这并非是这一两年的作用，而是持续积累下来的成果。在今天，我们还把人工智能当作新闻来看，再过五年，人们并不觉得它是新闻，它已经变成事实了。这个行业所产生的影响和市场已经大大增加，我相信在五年以后，人工智能在安防领域的市场会比今天大一百倍。

　　《网络传播》：计算机视觉对安防的意义有哪些？相比之下，格灵深瞳的安防设备和其他安防设备有哪些不同之处？

　　赵勇：安防行业已经建立了一套完整的“眼睛”体系，到处都有摄像头，这些摄像头从以前的模拟变成了数字，从孤立变成了网络连接。所以，在安防领域锻炼出来了一种能力——眼睛和记忆的能力。但是，过去我们只用了电脑的眼睛和记忆，真正思考和选择的还是人脑。而未来的核心则是赋予摄像头“思考”的能力。

　　北京200多万个摄像头，每天产生的录像时长有200多万天，即5000多年，这么多的图像，倘若要抓取数据，需要耗费大量的人力。所以，格灵深瞳就是为每台计算机装上“安全脑”。这个安全脑首先要去理解每幅图的所有目标，识别他们是谁；其次，它不是单个脑子，而是一套协同合作的脑袋网。以前是海量的孤立的数据，未来安全脑会搜集所有的数据，去理解、关联和分析这些数据，最终为客户提供情报。

　　《网络传播》：除了安防领域，计算机视觉还能用在哪些行业？

　　赵勇：比如，可以为商场提供VIP客户识别服务。当顾客走进商场，系统根据人脸识别提示这是一位VIP客户，服务员接到指令，便会有针对性地提供服务。此外，可以为父母提供孩子的动态，当孩子进入学校、离开学校、进入小区门口时，父母都能收到信息提示，告知父母孩子的行踪。

　　在这个世界上，每一个人都有他的关键人。对于商场来说，顾客是他们的关键人；对于父母来说，孩子是他们的关键人。我们的技术就是为人们提供这种服务，帮助他们去了解各自的关键人。

　　《网络传播》：计算机视觉在安防领域已经达到了“让机器看得懂”的目标，那么，下一步，怎样实现“让计算机做出反应”？

　　赵勇：现在已经可以做出反应了。所谓的做出反应就是提供情报，人工智能领域是一个情报体系，而非执行体系。人工智能产品提供情报，然后由执法机关采取相关行动。比如，有犯罪高危人员走进小区了，通过人脸识别，系统提示保安注意防范，保安接收到情报后，便会密切注意这个人的动态，这就是情报服务。

　　把未来一个齿轮一个齿轮地变成现实

　　《网络传播》：斯皮尔伯格导演的科幻电影《人工智能》里描绘了一个机器人小孩为了得到人类的“母爱”而不断“努力”的故事，影片结局是2000年之后，地球上已经没有了人类，只剩下机器人。你觉得人类会迎来这一天吗？

　　赵勇：这是艺术创作，好莱坞的电影为了制造噱头吸引人们去看，所以会幻想比较极端的科幻场景。我们今天让人工智能去开车、去服务、去提供情报，但它们其实是没有物理形态的，而是一系列运行在服务器和系统里面的软件。它们有感知和认知的能力，能很好地完成工作，可以为我们提供非常出色的服务，但它们是没有意识的。

　　人的智能有三个层次，感知、认知、意识。但对机器人来说，它们可能有超过人类的感知和认知能力，但并不具备意识。什么是意识？意识是一个指挥官，它调动了你的感知和认知能力，去完成任务。人工智能的未来并不是去创造一堆有自我意识的机器人，成为一种新的物种。我们今天所做的所有人工智能，都只是做一种很聪明的机器，其终极目标都是为人类服务。

　　《网络传播》：好莱坞创造了很多同时具备感知、认知和意识的机器人，例如暖心的大白。你预测一下，人类何时会真正意义上拥有一个大白这样的朋友？

　　赵勇：现在已经开始了，人工智能不一定是人形的东西，在家里就有隐形的大白。比如，智能牙刷能通过口腔脱落细胞判断你的口腔健康状况；智能马桶可以帮你分析肠道疾病；拿一根棉签掏一下耳朵，产生一些采样，快递到一个实验室，它们会立即给你一个非常权威的报告。这些东西就是大白。

　　大白不是一个大白，是无数个大白。有大白的医院版、大白的药物版、大白的家庭诊疗版等等，这都是会出现的。当然，我不认为会出现一个大白那样的机器人，把所有事儿都办了。无论从技术可行性和效率来说，都达不到那样的要求。

　　《网络传播》：有人说在人工智能的发展上存在一个奇点，越过这个奇点就能具备意识。你觉得这个奇点存在吗？

　　赵勇：在认知和感知领域，人工智能的很多东西已经超过人类了，但在意识层面就差得远了。人类最宝贵的东西便是灵魂，而人工智能最大的缺陷也在于此。机器人最困难的是拥有意识，因此，应该捍卫人类的灵魂和情感，一方面让机器人拥有情感很难，另一方面，人们不应该去触碰情感机器人的研究，因为这触及了人类伦理和情感层面的底线。（文 / 本刊记者潘树琼）

关闭

首页

时政要闻

网信政务

互动服务

热点专题

格灵深瞳：让计算机看懂世界

学习强国

微信

返回顶部

首 页

时政要闻

网信政务

互动服务

热点专题

格灵深瞳：让计算机看懂世界

学习强国

微信

返回顶部

首页