智能家居市场：3趋势，有可为；4挑战：如何为?

yanfei 2020-12-08 11:19

在智能家居领域，虽然众多企业早已涉足，但一个最具推广性和可靠性的技术模式仍在探索之中。近日，地平线副总裁张永谦出席在AWE举办的论坛，围绕“智能家居时代的机遇和挑战”发表了地平线的观点，并介绍了地平线在这方面的技术突破和解决方案。

QQ截图20201208112905.png

中国智能家居市场规模十分巨大

中国有1亿的中产阶级家庭，这一亿家庭年平均收入在30万到70万人民币左右，他们是智能家居市场的主力消费人群，足见智能家居市场的规模之大。当然，说到智能家居，很多人的第一个印象是电子设备，这个市场确实很大，有1万亿。但其实智能家居市场真正的“潜力股”是家庭消费和服务——每年的市场可以达到50万亿，其中有10%通过线上进行。如果企业能够更方便、更快捷和更精准的帮助消费者进行家庭消费、提供服务，那么它将获得巨大的成功。

智能家居市场三个变化趋势

通过对这个市场发展趋势的思考，我们可以发现三个比较明显的变化，是已经发生或者会很快发生的。

第一个是物理入口，目前最主要的入口是手机和PAD等，这个入口是非常拥挤的，千军万马挤独木桥。将来一个非常明显的趋势就是，整个消费和服务的接入是分散到各个智能设备的。将来在家里，每一个硬件都是一个独立的APP。你发现冰箱里面没有饮料的时候，你不需要拿出手机，解锁，打开APP等购买，这个用户体验是很差的。你可以直接一句话告诉冰箱，下午给我送一打啤酒过来。

第二个是交互方式，最传统的是键盘和触摸屏。随着人工智能的发展，语音技术也将很快的普及到我们的生活中。但我们认为，在不远的将来会有一个更为重要、更为重量级的方式，那就是通过视觉的交互。因为现在大家可以看到，不管是通过触控还是通过语音进行交互，其实都是人类主动决策、机器被动接受的过程。而视觉是主动交互。

视觉交互带来了第三个变化，那就是机器主动决策——人类不需要关注很多家庭的事情了，连命令都不用下，机器就能在最合适的时间完成服务。举个例子，现在已经有上门洗衣的服务了，我们可以想象一下，将来家里面在阳台上放一个大的篮子，把脏衣服扔进去，阳台有一个摄像头，看到这个篮子里面的衣服累计到一定程度的时候，自动的联系上门的洗衣服务，全程不用人类操心。将来的消费以及服务会更多的是通过AI主动推荐的模式，这个里面带来的市场商业机会是会远远大于传统模式的。因为视觉相比语音和触控是更高维的沟通方式，它能收集到的信息远大于触控和语音这样的二维方式带来的信息。

智能家居市场面临的挑战

谈完潜在的变化后，智能家居市场虽然讲了很多年，但还没有真正的“爆发”起来，为什么呢?我们认为主要有四个方面的原因。

第一个是应用场景分散，有安全、娱乐、家庭服务、健康、教育等非常多的场景，另外家里面的智能设备过于分散，比如家电，玩具、机器人、摄像头等等，所有这些分散的应用场景和电子设备会导致当我们把它们智能化的时候，很难快速复制。

第二个挑战，是技术。家庭场景很复杂，需要能处理语音和图像，做到很好的感知、认知，技术挑战直到今天仍然很大。

第三个，数据。数据的搜集和分析是一个很难的过程，首先，家里面每个场景都是高度分散化的，每个家庭的需求也是不一样的。其次，只拿到大数据是远远不够的，因为即使家里安装上很多的传感器，搜集到很多的数据，但是这些数据绝大部分都是垃圾数据，如果不停的把这些数据上传到云端处理，会占用巨大的带宽和云端处理资源，不具备可操作性。所以我们搜集数据的时候，我们要思考，不仅仅要搜集数据，而且要搜集真正有价值的数据。但是这个事情并不是这么容易做到的。

第四个挑战，真正的用户体验很难。我们服务的对象是人，对于体验的要求很高。我们现在人工智能的技术得到了很快的发展，但尚不能真正让人感觉到交互方式和服务方式非常自然。

有了这些挑战，人工智能在智能生活上的普及，我们觉得一定不是一蹴而就的事情，一定需要一段时间的慢慢积累。

如何应对智能家居的这些挑战

应对这些挑战，地平线有自己的观点。

第一，应用场景分散的问题，我们认为要抓住其中的主要矛盾，和不变量，就是“人”，我们现在智能家居这个领域就应该把人做透。比如安全问题，现在家里面装很多摄象头主要的目的是为了安全，而安全其实核心是什么呢?最主要的是想知道家里有没有人，是家里人还是陌生人，以及这个人的行为，他做的行为是安全的行为还是不安全的，比如小孩子进入厨房，会不会点煤气灶，这些都是不安全的行为。所有应用场景都是围绕人。比如娱乐，家庭服务、健康、教育等等，就不一一举例了，我们地平线做的就是从人脸，到人的行为分析，到人周围环境，以及这个人的语音和设备的交互，我们主要的核心点就是围绕人，把这个技术做好，支撑巨大的分散的智能家居的需求。

第二个是技术上的挑战，人的交互方式和获取信息的方式其实是一个融合的方式，单独的语音和图像，或者单独的其他任何传感器，都不能涵盖所有的应用场景。所以一定是要图像+语音。另外视觉是高维高价值的，80%的价值信息来自于图像，只有20%来自于语音，在技术上要完成对智能家居最好体验的布局，必须把图像和语音的技术融合，单独的做语音或图像都是缺位的。

第三个数据的挑战。要获取有价值的数据，怎么获取呢?这个本身是不容易做到的，我们的思路也是比较清晰，就是做嵌入式的人工智能“端+云”的方式。端侧呢，现在我们谈到所谓的人工智能创业公司也好，大公司也好，他们其实更多的是在云上做，但是端上有不可取代的价值。主要是几个方面，第一，端是不依赖于网络的，不管是在家里，还是哪里，大家会发现家里的无线网络覆盖很难做到完美，如果是在楼下，或者是在移动的场景中，网络的全覆盖更是一个很难的事情，特别是当你牵涉到一些智能图像处理的时候，你很难实时地把图像传到云端再处理回来，这个时候实时性没有了。第二，端上可以对数据进行选择，只把有价值的数据传到云端。比如我阳台上有一个洗衣服的篮子，我就只关注这个里面衣服满的时候，这个状态我传到云端。如果这个里面衣服没有满，99%的时间，这些数据是毫无意义的，就抛弃了。必须采用一个端+云的方式，这样才有可能真正的做到最高效，而且是最有性价比的智能服务。

有了端上的智能以后，在云端可以做很多的事情，一个是可以用数据迭代模型，持续的优化用户的体验;另外是每一个硬件，将来都是和手机的形态一样，他在上面都可以下载很多的智能APP，这个硬件可能已经脱离了原来的形态了，你买回来的时候可能是一个家电，也可能是一个机器人，但是随着智能的升级，他可以具备很多全新的属性和功能。

当我们真的有了这个大数据，也对人的喜好有了了解以后，这个就不局限在家里了，当我们到任何一个地方都可以通过云端升级本地的智能设备，让他们变成像家里一样最懂我的环境。将来的智能家居市场一定是端+云的架构。

第四个，真正的用户体验，这是非常难的事情。举个例子，语音，不仅要支持远场和近场，识别一些带口音的普通话，甚至是方言。还要考虑实际应用中，如果很多人同时讲话的时候，家里很多语音设备的识别率就会下降的比较厉害。所以当我们做技术时，一定要考虑实际的使用场景。图像也是一样，比如人脸识别，如果你离的很近，确实识别得很好，但是如果离得比较远，如果是走动的状态下，如果是背光的情况下，怎么办?这些都要解决，只有这样用户体验才能真正好，消费者才真正的愿意使用这个技术，这个市场才能真正的起来。另外一个，我们的技术更多还要努力让摄像头做到主动的服务，要懂用户，只有懂用户才能使用户得到好的体验。